hadoop3.3完全分布式(最简)

news/2025/2/16 6:05:26/

环境准备

  • 3台CentOS7(本例使用VMware替代)
  • jdk8
  • Hadoop3.3

虚拟机基础准备

  • 网络适配器选用NAT模式(针对VMware)
  • 设置静态IP,对应关系如下
名称地址
hadoop01192.168.138.201
hadoop02192.168.138.202
hadoop03192.168.138.203
  • 设置主机名,在各自机器上执行hostnamectl set-hostname 主机名称即可
  • 将jdk、Hadoop安装包分别上传至hadoop01:/hadoop目录下

接下来的操作,我会标明在那个机器里面操作,执行的时候切记不要执行错了

hadoop01中执行

解压安装包
cd /hadoop
// 解压jdk
tar -xzvf jdk*
// 解压hadoop
tar -xzvf hadoop*
// 删除安装包
rm -rf ./*.gz
// 重命名jdk
mv jdk* jdk8
// 重命名hadoop
mv hadoop* hadoop3
安装jdk

使用命令vi /etc/profile将如下代码添加到末尾

export JAVA_HOME=/hadoop/jdk8
export CLASSPATH=.$JAVA_HOME/lib/dt.jar:$JAVA_HOME/lib/tools.jar
export PATH=$JAVA_HOME/bin:$PATH

配置完成后执行source /etc/profile重新加载配置文件
然后使用java -version测试jdk是否安装成功

安装Hadoop

1、配置环境变量

使用命令vi /etc/profile将如下代码添加到末尾

export HADOOP_HOME=/hadoop/hadoop3
export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH

配置完成后执行source /etc/profile重新加载配置文件

2、修改Hadoop配置文件

涉及修改的文件有core-site.xml、hadoop-env.sh、hdfs-site.xml、mapred-site.xml、yarn-site.xml、workers

  • core-site.xml
 <property><name>fs.defaultFS</name><value>hdfs://hadoop01:9000</value></property>
  • hadoop-env.sh
export JAVA_HOME=/hadoop/jdk8
export HDFS_NAMENODE_USER="root"
export HDFS_DATANODE_USER="root"
export HDFS_SECONDARYNAMENODE_USER="root"
export YARN_RESOURCEMANAGER_USER="root"
export YARN_NODEMANAGER_USER="root"
  • hdfs-site.xml
  <property><name>dfs.replication</name><value>2</value></property><property><name>dfs.namenode.name.dir</name><value>/hadoop/hadoop3/hdfs/name</value></property><property><name>dfs.datanode.data.dir</name><value>/hadoop/hadoop3/hdfs/data</value></property>
<!-- nn web 端访问地址--> <property> <name>dfs.namenode.http-address</name> <value>hadoop01:9870</value> </property> <property><name>dfs.permissions</name><value>false</value></property>
  • mapred-site.xml
  <property><name>mapreduce.framework.name</name><value>yarn</value></property>
  • yarn-site.xml
  <property><name>yarn.resourcemanager.hostsname</name><value>hadoop01</value></property><property><name>yarn.resourcemanager.webapp.address</name><value>hadoop01:8088</value></property><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
  • workers
hadoop01
hadoop02
hadoop03
修改hosts文件

使用vi /etc/hosts编辑文件,在末尾加入

192.168.138.201 hadoop01
192.168.138.202 hadoop02
192.168.138.203 hadoop03
将jdk、hadoop等文件分发给其他机器
// hadoop02
// 配置文件
scp -r /etc/profile hadoop02:/etc/
// 映射关系
scp -r /etc/hosts hadoop02:/etc/
// 安装文件
scp -r /hadoop hadoop02:/// hadoop03
scp -r /etc/profile hadoop03:/etc/
scp -r /hadoop hadoop03:/
scp -r /etc/hosts hadoop03:/etc/

以下命令三个机器全部执行

1、刷新配置文件

source /etc/profile

2、配置ssh免密登录

  • 生成密钥(一路回车直到结束)
ssh-keygen -t rsa
  • 分发公钥
ssh-copy-id hadoop01
ssh-copy-id hadoop02
ssh-copy-id hadoop03

3、关闭防火墙

systemctl stop firewalld.service
systemctl disable firewalld.service

hadoop01中执行

  • 格式化namenode
hdfs namenode -format
  • 启动hadoop
start-all.sh

到此搭建已经完成,访问web页面http://192.168.138.201:8088即可,


http://www.ppmy.cn/news/1271587.html

相关文章

拓展进阶:Python 中 Scipy 的优化与拟合

写在开头 在我们的Python科学计算之旅中&#xff0c;我们已经学习了Scipy库的基础功能&#xff0c;涉及数学运算、数据处理、统计分析等方面。然而&#xff0c;在实际的数据分析和科学研究中&#xff0c;我们经常面临着需要进一步优化算法和拟合数据的需求。本文将深入研究Sci…

linux 文本信息查询grep;控制命令执行和管道操作符号

1、grep grep "keyword" /path/to/logfile获取查询结果最后一行 grep "runs/detect/train" test4.log | tail -n 12、linux控制命令执行和管道操作符号 &、|、; 和 &&、》、>、< ##例子&#xff1b;wandb disabled && yolo …

【送书活动】探究AIGC、AGI、GPT和人工智能大模型

文章目录 前言01 《ChatGPT 驱动软件开发》推荐语 02 《ChatGPT原理与实战》推荐语 03 《神经网络与深度学习》推荐语 04 《AIGC重塑教育》推荐语 05 《通用人工智能》推荐语 后记赠书活动 前言 人工智能技术在过去几年中发展迅猛&#xff0c;得益于大数据、云计算、深度学习等…

unknown error 1146

Error 1146 in MySQL 是指找不到指定的数据库表。这个错误通常发生在你试图访问或操作一个不存在的数据库表时。 解决方式&#xff1a; 确保你使用的表名是正确的&#xff0c;检查拼写和大小写是否与数据库中的表名匹配。确保你正在使用正确的数据库。你可以使用以下命令切换到…

如何使用Docker进行容器的备份和恢复

一 简介&#xff1a; 在使用Docker进行应用程序的容器化部署时&#xff0c;我们经常需要对容器进行备份和恢复操作。备份容器可以保证数据的安全性&#xff0c;而恢复操作可以帮助我们快速恢复出现问题的容器。本文将介绍如何使用Docker进行容器的备份和恢复&#xff0c;同时提…

高防CDN在游戏服务商中的关键意义

随着网络攻击的日益普遍和恶化&#xff0c;游戏服务商面临着保障游戏服务安全和稳定性的迫切需求。在这一背景下&#xff0c;高防CDN&#xff08;内容分发网络&#xff09;技术逐渐成为游戏服务商不可或缺的利器。本文将从游戏服务商的角度分析高防CDN在游戏行业中的关键意义&a…

深度学习环境配置

一、Anaconda安装 下载&#xff1a;从清华大学开源软件镜像下载 镜像网址 出现base即为安装成功&#xff1a; 检查显卡的驱动是否正确安装&#xff1a; &#xff08;GPU可以显示出名称&#xff09; GPU0是集显集成显卡是主板自带的显卡。 GPU1是独显即独立显卡&#xff0c…

log4j2 xml 配置文件 屏蔽 第三方 依赖包 的日志

<!-- 第三方日志系统 逐个屏蔽 --> <logger name"org.springframework.core" level"info"/> <logger name"org.springframework.beans" level"info"/> <logger name"org.springframework.context"…