【Hadoop3.3.6全分布式环境搭建】

news/2024/11/7 22:35:43/

  • 说明:

    • 完成Hadoop全分布式环境搭建,需准备至少3台虚拟机(master slave01 slave02)
  • 环境:

    • VMWare + Centos7 + JDK1.8+ Hadoop3.3.6
  • 主机规划:

    • 主节点:master
    • 从节点:slave01 , slave02
      在这里插入图片描述

一、准备工作

  • 1、所有主机安装jdk

    • 上传jdk-8u171-linux-x64.tar.gz到/root目录下,然后执行下面的命令进行解压安装

      tar -zvxf jdk-8u171-linux-x64.tar.gz -C /opt/software/
      
    • 配置环境变量,执行:
      vim ~/.bash_profile
      在.bash_profile文件中添加如下信息:

      export JAVA_HOME=/opt/software/jdk1.8.0_171
      export JRE_HOME=$JAVA_HOME/jre
      export CLASSPATH=.:$CLASSPATH:$JAVA_HOME/lib:$JRE_HOME/lib
      export PATH=$PATH:$JAVA_HOME/bin:$JRE_HOME/bin;
      
    • 让环境变量生效
      source ~/.bash_profile

    • 验证jdk是否安装成功
      java -version

  • 2、所有主机都需要关闭防火墙

    systemctl stop firewalld.service
    systemctl disable firewalld.service
    
  • 3、所有主机都需要配置主机名映射关系 vim /etc/hosts,在文件末尾添加如下内容,注意:IP地址改成你自己环境的IP地址

    192.168.36.135 master
    192.168.36.136 slave1
    192.168.36.137 slave2
    
  • 4、配置免密码登录(配置两两之间的免密码登录)
    所有的机器都需要产生一对密钥:公钥和私钥
    ssh-keygen -t rsa
    所有主机需要执行

    ssh-copy-id -i .ssh/id_rsa.pub root@master
    ssh-copy-id -i .ssh/id_rsa.pub root@slave01
    ssh-copy-id -i .ssh/id_rsa.pub root@slave02
    
  • 5、保证每台机器的时间是一样的(可选做
    如果不一样的话,我们在执行MapReduce程序的时候可能会存在问题.。 解决方案:
    1)搭建一个时间同步的服务器,网上很多教程可以使用
    2)使用putty/shell工具,可以简单实现这个功能:
    date -s 2024-03-16后面必须敲一个回车

二、在主节点上进行安装配置(master)

  • 上传hadoop安装包,解决配置环境变量
    tar -zvxf hadoop-3.3.6.tar.gz -C /opt/software/
    注意需要同时设置:master slave1 slave2

    export HADOOP_HOME=/opt/software/hadoop-3.3.6
    export PATH=$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$PATH
    
  • 创建用于格式化和数


http://www.ppmy.cn/news/1439831.html

相关文章

代码随想录算法训练营第三十九天| 62.不同路径,63. 不同路径 II

目录 题目链接:62.不同路径 思路 代码 题目链接:63. 不同路径 II 思路 代码 总结 题目链接:62.不同路径 思路 ①dp[i][j]表示从(0,0)到(i,j)有dp[i][j]条路径 ②递推公式:dp[i][j] dp[i][j-1] dp[i-1][j],只…

翻译《The Old New Thing》 - Why .shared sections are a security hole

Why .shared sections are a security hole - The Old New Thing (microsoft.com)https://devblogs.microsoft.com/oldnewthing/20040804-00/?p38253 Raymond Chen 2004年08月04日 许多人会推荐使用共享数据节作为在应用程序的多个实例之间共享数据的一种方式。这听起来是个好…

开源代码分享(22)-基于拉格朗日松弛的电动汽车分布式充放电调度

1.分布式充放电控制方法 与集中式控制中调度机构直接下达充电指令不同 , 分布式控制中 ,调度机构根据系统运行状况发出调度信号 , 用户接收调度信号优化充放电过程 、确定充放电曲线 , 并上报调度中心 。 当电动汽车数量较多时 &…

Java基础入门day40

day40 DQL 分组补充 create table student(sid int,name varchar(20),sex char(6),score double,cid int ); ​ insert into student values(100, wukong, male, 99, 1); insert into student values(101, wuneng, male, 59, 1); insert into student values(102, wujing, ma…

Python编程----递归求解兔子的数量

描述 兔子的数量以这样的方式增长:每个月的兔子数量等于它前一个月的兔子数量加它前两个月的兔子数量,即f(n)f(n-1)f(n-2)。假设第1个月的兔子有2只,第2个月的兔子有3只,你能使用递归的方法求得第n个月的兔子有多少只吗&#xff…

SN75107BDR 总线接收器 中文资料_PDF中文资料_参数_引脚图

SN75107BDR 规格信息: 制造商:Texas Instruments 产品种类:总线接收器 RoHS:是 接收机数量:2 Receiver 接收机信号类型:Differential 电源电压-最小:/- 4.75 V 电源电压-最大:/- 5.25 V 工作电源电流:30 mA 最小工作温度:0 C 最大工作温度: 70 C 封装 / 箱…

【深度学习】烟雾和火焰数据集,野外数据集,超大量数据集,目标检测,YOLOv5

标注了2w张数据集,是目标检测yolo格式的,有火焰、烟雾两个目标,下图是训练时候的样子: 训练方法看这里: https://qq742971636.blog.csdn.net/article/details/138097481 数据集介绍 都是博主辛苦整理和标注的&…

Esp8266 - USB开关分享(开源)

文章目录 简介推广自己gitee项目地址:嘉立创项目地址:联系我们 功能演示视频原理图嘉立创PCB开源地址原理图PCB预览 固件烧录代码编译烧录1. 软件和驱动安装2. 代码编译1. 安装所需要的依赖库文件2. 下载源代码3. 烧录代码 使用说明1. 设备配网2. 打开设备操作页面3…