使用dataGrip连接spark

embedded/2024/11/20 14:58:07/

概述:

spark的配置共有5种

        1、本地模式

        2、集群模式:standalone, yarn,k8s,mesos四种集群模式

spark本身只是一个计算引擎,是没有数据库的,所以说数据需要在hdfs上存放,而数据库就是使用hive,都已经启动hdfs了,就使用yarn模式即可,而使用standalone模式就不合适了。

        因此以下的配置是基于hdfs+yarn+spark进行配置的。

一、配置

要想spark知道hive中所有的数据库,那么就需要将spark和metastore服务联系起来

1、在hive下的hive-site.xml中添加

<property><name>hive.metastore.schema.verification</name><value>false</value></property>

2、将hive的该文件复制到spark的conf下


cp /opt/installs/hive/conf/hive-site.xml /opt/installs/spark/conf

3、分发一下spark中的该文件

xsync.sh opt/installs/spark/conf/hive-site.xml

二、启动

1、启动hadoop
2、启动metastore
3、启动Spark Thrift Server

启动ThriftServer:若已经启动过hiveserver2 那么记得将端口号改为10001

opt/installs/spark/sbin/start-thriftserver.sh \
--hiveconf hive.server2.thrift.port=10000 \
--hiveconf hive.server2.thrift.bind.host=bigdata01 \
--master yarn \
--conf spark.sql.shuffle.partitions=2

hiveServer2 和 thriftserver的区别:

只需访问 Hive 表,无需 Spark 的计算能力:
使用 HiveServer2,更简单,且原生支持 Hive 功能。

需要访问 Hive 表,并利用 Spark 的计算引擎:
使用 Spark Thrift Server,可以充分利用 Spark 的分布式计算能力。


http://www.ppmy.cn/embedded/139100.html

相关文章

高质量发展统计监测

我国经济迈向高质量发展&#xff0c;在统计标准和统计制度上采取了哪些措施及时监测反映经济转型发展状况&#xff1f; 随着我国经济从高速增长阶段转向高质量发展阶段&#xff0c;经济转型发展也对统计工作提出了新的要求。为服务我国高质量发展要求&#xff0c;为经济社会转…

Java基于微信小程序+SSM的校园失物招领小程序

博主介绍&#xff1a;✌程序员徐师兄、7年大厂程序员经历。全网粉丝12w、csdn博客专家、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java技术领域和毕业项目实战✌ &#x1f345;文末获取源码联系&#x1f345; &#x1f447;&#x1f3fb; 精彩专栏推荐订阅&#x1f447;…

【单片机基础】通信接口(UART, SPI, I2C等)的工作方式

单片机&#xff08;Microcontroller Unit, MCU&#xff09;中的通信接口用于与外部设备进行数据交换。常见的通信接口包括UART&#xff08;Universal Asynchronous Receiver/Transmitter&#xff09;、SPI&#xff08;Serial Peripheral Interface&#xff09;和I2C&#xff08…

solana链上智能合约开发案例一则

环境搭建 安装Solana CLI&#xff1a;Solana CLI是开发Solana应用的基础工具。你可以通过官方文档提供的安装步骤&#xff0c;在本地环境中安装适合你操作系统的Solana CLI版本。安装完成后&#xff0c;使用命令行工具进行配置&#xff0c;例如设置网络环境&#xff08;如开发网…

【ArcGISPro】使用AI模型提取要素-提取车辆(目标识别)

示例数据下载 栅格数据从网上随便找一个带有车辆的栅格数据 f094a6b1e205cd4d30a2e0f816f0c6af.jpg (1200799) (588ku.com) 添加数据

小米运动健康与华为运动健康在苹手机ios系统中无法识别蓝牙状态 (如何在ios系统中开启 蓝牙 相册 定位 通知 相机等功能权限,保你有用)

小米运动健康与华为运动健康在苹手机ios系统中无法识别蓝牙状态 &#xff08;解决方案在最下面&#xff0c;参考蓝牙权限设置方式举一反三开启其它模块的权限&#xff09; 最近买了一台小米手表s4&#xff0c;但是苹手机ios系统中的 “小米运动健康” app 始终无法识别我手机…

网络安全进阶

网络安全进阶知识涉及更深入的技术细节和高级防护措施。为了更详细地讲解网络安全的进阶知识&#xff0c;我们将每个关键领域和技术进一步展开&#xff0c;提供更多的背景信息、具体技术细节和实际应用案例。 1. 高级威胁检测与响应 威胁情报 (Threat Intelligence) 威胁情报…

【企业级分布式系统】ELK优化

文章目录 Elasticsearch作为日志存储时的优化优化ES索引设置优化线程池配置锁定内存&#xff0c;不让JVM使用Swap减少分片数、副本数 Elasticsearch作为日志存储时的优化 linux内核优化、JVM优化、ES配置优化、架构优化&#xff08;filebeat/fluentd代替logstash、加入kafka做…