HIVE表操作

embedded/2025/2/28 7:32:46/

Hive有四种表:内部表,外部表,分区表,分桶表。分别对应不同的需求。又可将他们分为两组内部表和外部表、分区表和分桶表,其中分区表在企业中用的最多,可以说百分之八九十的表都是分区表。

创建表

方式1:基本创建

-- EXTERNAL 代表外部表 
CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name 
[(col_name data_type [COMMENT col_comment], ...)] 
[COMMENT table_comment] :----重要
-- 分区表设置 分区的字段和类型
[PARTITIONED BY (col_name data_type [COMMENT col_comment], ...)] 
-- 桶表设置 按照什么字段进行分桶
[CLUSTERED BY (col_name, col_name, ...) 
-- 桶内的文件 是按照 什么字段排序   分多少个桶
[SORTED BY (col_name [ASC|DESC], ...)] INTO num_buckets BUCKETS] 
-- 分隔符 + 序列化反序列化
[ROW FORMAT row_format] 
-- 表存储格式格式
[STORED AS file_format] 
-- 表所对应的hdfs目录
[LOCATION hdfs_path]
[TBLPROPERTIES (property_name=property_value, ...)]

方式2:create table as select建表

该语法允许用户利用select查询语句的结果,直接建表,表的结构和查询语句的结构保持一致,并且包含查询语句里的所有内容。

CREATE  TABLE [IF NOT EXISTS] table_name

[AS select_statement]

[COMMENT table_comment]

[ROW FORMAT row_format]

[STORED AS file_format]

[LOCATION hdfs_path]

[TBLPROPERTIES (property_name=property_value, ...)]

as:后跟查询语句,根据查询结果创建表。

方式3:create table like建表

该语法允许用户复制一张已经存在的表的结构,但是和上面的CTAS语法不同,该语法创建出来的表中不包含数据。

CREATE TABLE [IF NOT EXISTS] table_name

LIKE table_name

[COMMENT table_comment]

[ROW FORMAT row_format]

[STORED AS file_format]

[LOCATION hdfs_path]

[TBLPROPERTIES (property_name=property_value, ...)]

like允许用户复制现有的表结构,但是不复制数据。

加载数据

----本地加载数据(hdfs 不需要加local)
load data local inpath "/home/hewwen8888/data/ch4_emp.txt"  overwrite into table ds_hive.ch4_emp;
-- hdfs上加载数据,不用local
load data  inpath "/user/hewwen8888/data/ch4_emp.txt"  overwrite into table ds_hive.ch4_emp_l;

区别:磁盘上的数据复制到hdfs上,hdfs的数据,移动到对应的表路径下的


http://www.ppmy.cn/embedded/167749.html

相关文章

大模型在癫痫预测及临床方案制定中的应用研究报告

目录 一、引言 1.1 研究背景与意义 1.2 国内外研究现状 1.3 研究方法与创新点 二、大模型技术概述 2.1 大模型的基本原理 2.2 常见大模型在医疗领域的应用 2.3 大模型用于癫痫预测的优势 三、大模型在癫痫术前预测中的应用 3.1 致痫灶定位预测 3.1.1 基于影像数据的…

网红框架SpringBoot2.x之框架简介及环境搭建

SpringBoot基于Spring框架进行“变态级“封装和扩展,由于上手简单、配置简单、集成简单,使得SpringBoot一跃成为近几年Java开发界的网红,加之众多的开源同僚的鼎力支持,为SpringBoot框架构建起了强大的开发生态圈。SpringBoot 1.x…

GPU和FPGA的区别

GPU(Graphics Processing Unit,图形处理器)和 FPGA(Field-Programmable Gate Array,现场可编程门阵列)不是同一种硬件。 我的理解是,虽然都可以用于并行计算,但是GPU是纯计算的硬件…

前端开发--node.js

Node.js 是一个基于 Chrome V8 引擎的 JavaScript 运行时环境,它使得 JavaScript 能够在服务器端运行,极大地扩展了 JavaScript 的应用范围。以下是关于 Node.js 的详细介绍: 特点 事件驱动:Node.js 基于事件驱动架构&#xff0…

2.8 通过微调提升模型的准确度与效率-大模型ACP模拟题-真题

单选题 模型量化技术的主要优势是&#xff1f; A. 显著提升模型精度 B. 减少显存占用和响应时间 ✅ C. 完全保留原始模型能力 D. 支持多模态任务扩展 解析&#xff1a;量化通过降低参数精度减少资源消耗&#xff0c;但对精度影响较小&#xff08;<2%&#xff09; 以下关于…

P8615 [蓝桥杯 2014 国 C] 拼接平方数

题目描述 小明发现 49 很有趣&#xff0c;首先&#xff0c;它是个平方数。它可以拆分为 4 和 9&#xff0c;拆分出来的部分也是平方数。169 也有这个性质&#xff0c;我们权且称它们为&#xff1a;拼接平方数。 100 可拆分 1,00&#xff0c;这有点勉强&#xff0c;我们规定&a…

【2025.2.25更新】wordpress免费AI插件,文章内容、图片自动生成、视频自动生成、网站AI客服、批量采集文章,内置deepseek联网满血版

wordpress免费AI插件&#xff0c;文章内容、文章图片、长尾关键词、视频自动生成、网站AI客服、批量采集文章&#xff0c;插件已接入腾讯云大模型知识引擎xDeepSeek&#xff0c;基于腾讯云大模型知识引擎xDeepSeek可联网满血版&#xff0c;插件可实现文章生成、长尾关键词生成、…

【滑动窗口算法】-- 最大连续1的个数

文章目录 1. 题目2. 题目解析3. 代码 1. 题目 在线oj 给定一个二进制数组 nums 和一个整数 k&#xff0c;假设最多可以翻转 k 个 0 &#xff0c;则返回执行操作后 数组中连续 1 的最大个数 。 示例 1&#xff1a; 输入&#xff1a;nums [1,1,1,0,0,0,1,1,1,1,0], K 2 输出&…