Hive SQL-DML-insert插入数据

ops/2025/1/30 23:10:50/

Hive SQL-DML-insert插入数据


在这里插入图片描述
在这里插入图片描述


1. 插入静态数据

在这里插入图片描述
可以直接插入具体的值到Hive表中:

sql">INSERT INTO TABLE tablename (column1, column2, column3)
VALUES (value1, value2, value3),(value4, value5, value6),...;

2. 插入查询结果

在这里插入图片描述

将一条查询的结果直接插入到另一个表中。这是一种很常见的操作,用于数据转移和转换:

sql">INSERT INTO TABLE tablename
SELECT column1, column2, column3
FROM othertable
WHERE condition;

3. 多重插入和静态分区插入

在这里插入图片描述

对于分区表,可以在插入时指定分区。这不仅可以提高查询效率,而且还能更好地管理数据:

sql">-- 插入到指定分区
INSERT INTO TABLE tablename PARTITION (partition_column='partition_value')
SELECT column1, column2, column3
FROM othertable
WHERE condition;

在这里插入图片描述

sql">-- 插入不同分区的数据
FROM from_table
INSERT INTO TABLE tablename PARTITION (partition1)
SELECT column1, column2 WHERE condition1
INSERT INTO TABLE tablename PARTITION (partition2)
SELECT column1, column2 WHERE condition2;

4. 动态分区插入

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Hive还支持在执行INSERT操作时动态创建分区。这需要设置一些配置参数,如启用动态分区:
在这里插入图片描述

sql">SET hive.exec.dynamic.partition=true;
SET hive.exec.dynamic.partition.mode=nonstrict;INSERT INTO TABLE tablename PARTITION (partition_column)
SELECT column1, column2, partition_column
FROM othertable;

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

5.导出数据

导出数据是从 Hive 中提取数据的过程,通常用于将数据转移到本地文件系统、HDFS 或其他数据存储中。

INSERT OVERWRITE 用于将查询结果或表数据写入到特定的输出位置。可以将数据导出到 HDFS 或本地文件系统。这个方法支持多种文件格式,如 Text、Parquet、ORC 等。

  • 导出到 HDFS:

    sql">INSERT OVERWRITE DIRECTORY '/path/to/hdfs/directory'
    SELECT * FROM my_table;
    
  • 导出到本地文件系统:

    sql">INSERT OVERWRITE LOCAL DIRECTORY '/path/to/local/directory'
    SELECT * FROM my_table;
    

在这两个示例中,数据将被导出到指定的 HDFS 或本地路径。默认情况下,数据以文本格式输出,但可以通过 STORED AS 选项指定不同的文件格式。

在这里插入图片描述
在这里插入图片描述
示例:
在这里插入图片描述
在这里插入图片描述

6.注意事项

  • Hive中的INSERT操作本质上是对文件的写操作。特别是在HDFS中,这意味着每次INSERT都会生成新文件。这可能会影响性能,特别是在大量小批量插入时。
  • 建议在执行大批量数据插入前调优Hive配置和考虑合适的文件格式和压缩机制。
  • 在执行大数据量的插入时,需要注意Hive服务器和Hadoop集群的资源配置,以避免过载。

http://www.ppmy.cn/ops/41206.html

相关文章

paddle ocr v4 2.6.1实战笔记

目录 效果图: 安装 模型权重是自动下载,如果提前下载会报错。 识别orc,并opencv可视化结果,支持中文可视化 官方原版预测可视化: 效果图: 安装 安装2.5.2识别结果为空 pip install paddlepaddle-gpu…

vscode 通过ssh 远程执行ipynb +可以切换conda env

主要是保证几个点 远程服务器python 环境没问题 conda这些也都有的ssh的账户 是有conda权限的没有免密就输入密码 免密教程就是最基本的那种 公钥copy过去就行了vscode 那几个插件都要装好 开始操作 首先 vscode 点击左侧工具栏中的扩展,搜索“ssh”,…

Acrobat Pro DC 2023 for Mac:PDF处理的终极解决方案

Acrobat Pro DC 2023 for Mac为Mac用户提供了PDF处理的终极解决方案。它具备强大的文档处理能力,无论是查看、编辑还是创建PDF文件,都能轻松胜任。在编辑功能方面,Acrobat Pro DC 2023支持对文本、图像进行精准的修改和调整,还能添…

C语言(指针)7

Hi~!这里是奋斗的小羊,很荣幸各位能阅读我的文章,诚请评论指点,关注收藏,欢迎欢迎~~ 💥个人主页:小羊在奋斗 💥所属专栏:C语言 本系列文章为个人学习笔记&#x…

【风变】Python爬虫精进复习-20240430

参考笔记 下面给出一个巨佬学习风变pyhton基础语法和爬虫精进的笔记(链接) 风变编程笔记(一)-Python基础语法 风变编程笔记(二)-Python爬虫精进 技术总结 request BeautifulSoup selenium BeautifulSoup 练习0-1:文章下载 import requ…

【多模态】30、Monkey | 支持大尺寸图像输入的多任务多模态大模型

文章目录 一、背景二、方法2.1 Enhancing Input Resolution2.2 Multi-level Description Generation2.3 Multi-task Training 三、效果3.1 Image Caption3.2 General VQA3.3 Scene Text-centric VQA3.4 Document-oriented VQA3.5 消融实验3.6 可视化 论文:Monkey : …

uni-app(三):离线打包与插件引用(Android)

离线打包与插件引用 1.下载Android离线SDK2.使用Android Studio打开离线打包项目并更新Gradle3.解决报错4.构建5.配置AppKeya.查看证书b.申请AppKeyc.配置AppKey 6.生成本地打包App资源7.拷贝App资源到Android项目中8.修改 appid9.修改Android项目配置文件10.下载证书并配置11.…

2024OD机试卷-分割均衡字符串 (java\python\c++)

题目:分割均衡字符串 题目描述 均衡串定义: 字符串 中只包含两种字符,且这两种字符的个数相同。 给定一个均衡字符串,请给出可分割成新的均衡子串的最大个数。 约定:字符串中只包含大写的 X 和 Y 两种字符。 输入描述 字符串的长度:[2, 10000]。 给定的字符串均为均…