Spark SQL读写Hive Table部署

server/2025/2/9 6:29:08/

个人博客地址:Spark SQL读写Hive Table部署 | 一张假钞的真实世界

官网参考文档:Hive Tables。

本文使用的组件版本如下:

  • Spark 3.1.2
  • Hive 3.1.2

第一步:Hive部署

在所有Worker节点上部署Hive。主要是使用Hive下面的libs。

第二步:Spark CLASSPATH

在${SPARK_HOME}/conf/spark-env.sh中添加以下内容:

export SPARK_DIST_CLASSPATH=$(hadoop classpath)

第三步:编译Spark

编译的目的是支持Hive。

./dev/make-distribution.sh --tgz -Phive -Phive-thriftserver -Pyarn -Dhadoop.version=3.2.2 -Phadoop-provided

第四步:部署Spark On Yarn

部署过程比较简单。部署过程遇到的问题参见另外一篇博文:Spark on YARN部署

第五步:兼容Hive 3.1.2

  • hive-site.xml复制到spark配置目录下。
  • 在配置文件spark-defaults.conf中添加以下内容。假设Hive安装目录为:/opt/hive
spark.sql.hive.metastore.version 3.1.2
spark.sql.hive.metastore.jars path
spark.sql.hive.metastore.jars.path file:///opt/hive/lib/*.jar

注意:这些Jar包需要使用Hive 3.1.2版本的。


http://www.ppmy.cn/server/166145.html

相关文章

springcloud gateway 负载均衡

Spring Cloud Gateway的负载均衡是Spring Cloud生态系统中一个非常重要的功能,它使得微服务架构中的服务调用能够更加高效和均衡。以下是关于Spring Cloud Gateway负载均衡的详细解析: 一、Spring Cloud Gateway简介 Spring Cloud Gateway是一个基于Sp…

cursor指令工具

Cursor 工具使用指南与实例 工具概览 Cursor 提供了一系列强大的工具来帮助开发者提高工作效率。本指南将通过具体实例来展示这些工具的使用方法。 1. 目录文件操作 1.1 查看目录内容 (list_dir) 使用 list_dir 命令可以查看指定目录下的文件结构: 示例: list_dir log…

ElasticSearch业务场景与面试题

以下是几个常见的 Elasticsearch 业务场景解决方案及面试题解析(含 Java 示例): 一、业务场景解决方案 场景 1:商品搜索与过滤 需求:电商平台需要支持多条件搜索(关键词、价格区间、分类、品牌&#xff09…

P1049 装箱问题(dp)

#include<bits/stdc.h> using namespace std;int main() {int v,n;cin>>v>>n;int a[30];int dp[20005];for(int i0;i<n;i){cin>>a[i];}memset(dp,0,sizeof(dp));// 设置所有元素为0&#xff0c;表示最大体积为0for(int i0;i<n;i){for(int jv;j&…

redis之GEO 模块

文章目录 背景GeoHash 算法redis中的GeoHash 算法基本使用增加距离获取元素位置获取元素的 hash 值附近的元素 注意事项原理 背景 如果我们有需求需要存储地理坐标&#xff0c;为了满足高性能的矩形区域算法&#xff0c;数据表需要在经纬度坐标加上双向复合索引 (x, y)&#x…

图文并茂-jvm内存模型

堆内存划分的空间&#xff0c;如何回收这些内存对象&#xff0c;有哪些回收算法&#xff1f; 推荐阅读 设计模式与技术组件图解Java类文件到虚拟机-CSDN博客

【AcWing】蓝桥杯辅导课-二分与前缀和

目录 二分 数的范围 数的三次方跟 机器人跳跃问题 四平方和 分巧克力 前缀和 前缀和 子矩阵的和 K倍区间 激光炸弹 二分 数的范围 789. 数的范围 - AcWing题库 #include<iostream> using namespace std;const int N 1e5 10;int n, q, k, a[N];int main()…

COBOL语言的云计算

COBOL语言与云计算&#xff1a;重新定义传统编程的未来 引言 在技术迅速发展的今天&#xff0c;云计算已成为推动企业数字化转型的关键力量。与此同时&#xff0c;许多传统编程语言依然在大型企业中发挥着不可或缺的作用。在这些传统语言中&#xff0c;COBOL&#xff08;Comm…