大数据原生集群 (Hadoop3.X为核心) 本地测试环境搭建二

ops/2025/1/15 21:46:23/

本篇安装软件版本

mysql5.6
spark3.2.1-hadoop3.2
presto0.272
zeppelin0.11.2
kafka_2.13_3.7.2


mysql

安装步骤见-》 https://blog.csdn.net/dudadudadd/article/details/110874570

spark

安装步骤见-》https://blog.csdn.net/dudadudadd/article/details/109719624
安装的时候要注意的点如下
1、3.x的spark一定要早env中改默认的master-web端口,默认的8080会导致内部资源404
2、3.x的spark和下面的hive3.x一样需要将jars下的guava-14包改个名字,不用自带的,将hadoop中share/hadoop/common/lib/guava-27.0-jre.jar包复制到jars目录下
3、3.x的spark在env文件中指定master的地址时,用的是SPARK_MASTER_HOST,而不再是SPARK_MASTER_IP,这一点一定要注意

presto

安装步骤见-》https://blog.csdn.net/dudadudadd/article/details/109726023 presto安装的时候虽然搭建在hadoop3.0体系上,但并不受影响,正常按照之前的方式配置hive的catalog就行

zeppelin

安装步骤见-》https://blog.csdn.net/dudadudadd/article/details/109719624
安装要注意:这个版本改动默认spark执行器的配置时,页面上的提示不准,需要正常的设置spark.master=yarnspark.submit.deployMode=cluster 才可以

kafka

安装步骤见–》https://blog.csdn.net/dudadudadd/article/details/109679296

需要注意的时较新的kafka版本在操作的时候,已经不再需要--zookeeper zookeeper集群地址这个配置了,你如果直接使用的话会提示你这个参数已经不再有效了,现在较新的kafka指定自身的bootstrap-server就行,底层在运行的时候会自动识别和处理zookeeper的链接信息,如下

[root@node1 ~]# /opt/kafka2.13_372/bin/kafka-topics.sh --create --bootstrap-server node1:9092 --replication-factor 1 --partitions 1 --topic test
Created topic test.
[root@node1 ~]# /opt/kafka2.13_372/bin/kafka-topics.sh --bootstrap-server node1:9092 --list
test

第一篇https://blog.csdn.net/dudadudadd/article/details/139886344


http://www.ppmy.cn/ops/150392.html

相关文章

Java爬虫能处理哪些反爬虫措施?

Java爬虫可以处理多种常见的反爬虫措施,以下是一些主要的反爬虫措施及其应对策略: 1. User-Agent检测 网站通常会通过User-Agent来判断访问者的身份。如果User-Agent显示为常见的爬虫程序,服务器可能会拒绝服务。因此,可以修改U…

【AI】探索 Anything LLM:解锁多领域语言模型的无限可能

探索 Anything LLM:解锁多领域语言模型的无限可能 随着大语言模型(LLM, Large Language Model)的快速发展,“Anything LLM” 的概念逐渐进入大众视野。它指的是一种能够适配多领域、多任务场景的通用型语言模型。相比于传统的单一…

java项目之网上点餐系统源码(springboot+mysql+vue)

大家好我是风歌,曾担任某大厂java架构师,如今专注java毕设领域。今天要和大家聊的是一款基于springboot的网上点餐系统。项目源码以及部署相关请联系风歌,文末附上联系信息 。 项目简介: 网上点餐系统的主要使用者分为管理员登录…

【从零开始使用系列】StyleGAN2:开源图像生成网络——环境搭建与基础使用篇(附大量测试图)

StyleGAN2 是英伟达团队 NVIDIA 提出的生成对抗网络(GAN)的一种改进版本。 它通过创新的网络架构,能够生成细节丰富、逼真的图像,特别在高频细节(如皮肤纹理、光照等)的表现上表现卓越。与传统 GAN 相比&am…

当生活低迷时,如何醒过走出迷境?

生活就像一场漫长的旅程,途中难免会遇到低谷和挫折。当生活陷入低迷时,我们该如何调整心态,重新找回自信,走出困境呢?今天,我想和大家分享一些从《毛泽东选集》中汲取的智慧,希望能给你带来启发…

MySQL数据库(SQL分类)

SQL分类 分类全称解释DDLData Definition Language数据定义语言,用来定义数据库对象(数据库,表,字段)DMLData Manipulation Language数据操作语言,用来对数据库表中的数据进行增删改DQLData Query Languag…

基于Springboot的汽车维修预约服务系统设计与实现

博主介绍:java高级开发,从事互联网行业多年,熟悉各种主流语言,精通java、python、php、爬虫、web开发,已经做了多年的设计程序开发,开发过上千套设计程序,没有什么华丽的语言,只有实…

windows和linux的抓包方式

1.实验准备: 一台windows主机,一台linux主机 wireshark使用: 打开wireshark,这些有波动的就代表可以有流量经过该网卡,选择一张有流量经过的网卡 可以看到很多的流量,然后可以使用过滤器来过滤想要的流量…