Hadoop 实战笔记(一) -- Windows 安装 Hadoop 3.x

ops/2025/1/12 12:13:16/

环境准备

  1. 安装 JAVA 1.8
    Java环境搭建之JDK下载及安装
  2. 下载 Hadoop 3.3.5 安装包
    Hadoop 下载:https://archive.apache.org/dist/hadoop/common/

一、JAVA JDK 环境检查

在这里插入图片描述

二、Hadoop(HDFS)环境搭建

hadoop335tar_10">1. 解压安装文件 hadoop-3.3.5.tar

在这里插入图片描述

2. 配置环境变量

HADOOP_HOME:D:\Development\HadoopHADOOP_USER_NAME:rootPath:%HADOOP_HOME%\bin;%HADOOP_HOME%\sbin;

3.配置Hadoop

检查 hadoop-3.3.5\etc\hadoop\hadoop-env.cmd 文件JDK的配置,通常无需改动

set JAVA_HOME=%JAVA_HOME%

如果报错的话配置为 JAVA 安装路径

set JAVA_HOME=C:\PROGRA~1\Java\jdk1.8.0_92

windowsd的cmd不允许设置变量路径带有空格,所以Java的安装目录需要不带空格

修改 hadoop/etc/hadoop/core-site.xml

<configuration><!--指定 namenode 的 hdfs 协议文件系统的通信地址--><property><name>fs.defaultFS</name><value>hdfs://localhost:9000</value></property><!--指定 hadoop 存储临时文件的目录--><property><name>hadoop.tmp.dir</name><value>D:\Development\Hadoop\data\tmp</value></property>
</configuration>

修改 hadoop/etc/hadoop/hdfs-site.xml

<configuration><property><name>dfs.namenode.name.dir</name><value>D:\Development\Hadoop\data\namenode</value></property><property><name>dfs.datanode.data.dir</name><value>D:\Development\Hadoop\data\datanode</value></property><!--由于我们这里搭建是单机版本,所以指定 dfs 的副本系数为 1-->	<property><name>dfs.replication</name><value>1</value></property><property><name>dfs.permissions.enabled</name><value>false</value></property>
</configuration>

4. 格式化NameNode :

第一次启动 Hadoop 时需要进行初始化,进入 ${HADOOP_HOME}/bin/ 目录下,执行以下命令:

进入 hadoop-3.3.5\bin 目录,执行 以下命令

hdfs namenode -format

在这里插入图片描述

5. 启动 HDFS

  • 进入 hadoop/sbin 目录,执行以下命令:
hadoop/sbin/start-dfs.cmdhadoop/sbin/start-yarn.cmd
  • 验证是否启动成功
    方式一:执行 jps 查看 NameNode 和 DataNode 服务是否已经启动:
[../sbin]# jps
5988 Jps
1964 DataNode
4572 NameNode
  • 查看集群状态
    http://localhost:9870/

在这里插入图片描述

三、Hadoop(YARN)环境搭建

1. 修改配置

进入 ${HADOOP_HOME}/etc/hadoop/ 目录下,修改以下配置:

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>
<configuration><!--配置 NodeManager 上运行的附属服务。需要配置成 mapreduce_shuffle 后才可以在 Yarn 上运行 MapReduce 程序。--><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property><property><name>yarn.nodemanager.aux-services.mapreduce_shuffle.class</name><value>org.apache.hadoop.mapred.ShuffleHandler</value></property><property><name>yarn.resourcemanager.hostname</name><value>localhost</value></property>
</configuration>

5. 启动服务

  • 进入 hadoop/sbin 目录,执行以下命令:
hadoop/sbin/start-yarn.cmd

6. 验证是否启动成功

  • 方式一:执行 jps 查看 ResourceManagerNodeManager 服务是否已经启动:
4112 Jps
2100 ResourceManager
1964 DataNode
4572 NameNode
4668 NodeManager
  • 方式二:查看 Web UI 界面,端口号为 8088,访问页面:http://localhost:8088/

在这里插入图片描述

参考:

  • Windows安装Hadoop3.x
    https://blog.csdn.net/qq_38628046/article/details/124217768
  • Windows环境下执行hadoop命令出现Error: JAVA_HOME is incorrectly set 解决办法
    https://www.cnblogs.com/zlslch/p/8580446.html

http://www.ppmy.cn/ops/149444.html

相关文章

【数据分析(一)】初探 Numpy

目录 前言1. 一维 array 的生成2. 一维 array 的基本操作2.1. 查看属性2.2. 花式索引2.3. 条件筛查2.4. 数据统计 3. n 维 array 的生成4. n 维 array 的基本操作4.1. 查看属性4.2. 查询和切片4.3. 花式索引4.4. 矩阵 前言 Numpy是Python的常用开源数值计算扩展库&#xff0c;用…

Docker Compose 教程

Docker Compose 是一个 Docker 容器的依赖管理工具。 例如我们一个服务需要依赖到多个 Docker 容器&#xff0c;那么使用 Docker Compose 这个工具就能很方便的帮助我们管理。 Docker Compose 通过配置文件 .yml。 定义了所有容器的依赖关系。 然后我们只需把我们想要的 Docke…

live555 俗称3个5 h264 rtp

class UsageEnvironment 这个类是顶层的容器&#xff0c;为万物之始。之后有啥new都带上它。 里面有个好宝贝TaskScheduler& fScheduler; f是field的意思&#xff0c;成员变量&#xff0c;与m_同。 class TaskScheduler 定义了 delayed task backgroudhadling even…

添加到 PATH 环境变量中

命令解释 # 将命令中的<CLI_PATH>替换为您aliyun文件的所在目录。 echo export PATH$PATH:<CLI_PATH> >> ~/.bash_profile echo export PATH$PATH:/data2/ljsang/aliyun/aliyun >> ~/.bash_profileexport PATH$PATH:/data2/ljsang/aliyun/aliyun&…

(Arxiv-2023)LORA-FA:针对大型语言模型微调的内存高效低秩自适应

LORA-FA&#xff1a;针对大型语言模型微调的内存高效低秩自适应 paper是香港浸会大学发表在Arxiv 2023的工作 paper title&#xff1a;LORA-FA: MEMORY-EFFICIENT LOW-RANK ADAPTATION FOR LARGE LANGUAGE MODELS FINE-TUNING ABSTRACT 低秩自适应 (LoRA) 方法可以大大减少微调…

Spring Boot教程之五十五:Spring Boot Kafka 消费者示例

Spring Boot Kafka 消费者示例 Spring Boot 是 Java 编程语言中最流行和使用最多的框架之一。它是一个基于微服务的框架&#xff0c;使用 Spring Boot 制作生产就绪的应用程序只需很少的时间。Spring Boot 可以轻松创建独立的、生产级的基于 Spring 的应用程序&#xff0c;您可…

Flutter项目开发模版,开箱即用(Plus版本)

前言 当前案例 Flutter SDK版本&#xff1a;3.22.2 本文&#xff0c;是由这两篇文章 结合产出&#xff0c;所以非常建议大家&#xff0c;先看完这两篇&#xff1a; Flutter项目开发模版&#xff1a; 主要内容&#xff1a;MVVM设计模式及内存泄漏处理&#xff0c;涉及Model、…

C++之开散列哈希表

目录 闭散列哈希表 元素的插入 元素的查找 元素的删除 上期我们学习了闭散列哈希表&#xff0c;闭散列哈希表和开散列哈希表的区别就是插入的元素在冲突时&#xff0c;应对冲突的处理方式不同&#xff0c;本期我们将详细的学习闭散列哈希表。 闭散列哈希表 闭散列哈希表图示…