mapreduce搭建

news/2024/11/24 2:24:48/

一.虚拟机安装CentOS7并配置共享文件夹
二.CentOS 7 上hadoop伪分布式搭建全流程完整教程
三.本机使用python操作hdfs搭建及常见问题
四.mapreduce搭建
五.mapper-reducer编程搭建

一、配置

cd /usr/local/hadoop/etc/hadoop/

cp mapred-site.xml.template mapred-site.xml

编辑mapred-site.xml

sudo gedit mapred-site.xml

替换

<configuration>
</configuration>

为

<configuration><property><name>mapreduce.framework.name</name><value>yarn</value></property>
</configuration>

修改yarn-site.xml

sudo gedit yarn-site.xml

configuration内容替换如下


<configuration><property><name>yarn.nodemanager.aux-services</name><value>mapreduce_shuffle</value></property>
</configuration>

在这里插入图片描述

删除/home/huangqifa/data（core-site.xml、hdfs-site.xml中的存储路径）

hadoop namenode -format

sh /usr/local/hadoop/sbin/start-all.sh

hadoop-daemon.sh start namenode

hadoop-daemon.sh start datanode

[huangqifa@hadoop4 ~]$ jps
3012 NameNode
3562 ResourceManager
4044 Jps
3869 NodeManager
3374 SecondaryNameNode
3167 DataNode

在这里插入图片描述

cd /usr/local/hadoop/share/hadoop/mapreduce/

hadoop jar hadoop-mapreduce-examples-2.7.7.jar pi 3 3

其中第一个3的含义是指开启3个map任务，第二个3是每个map里面投掷3次，这两个参数可以修改

在这里插入图片描述
参考网址：https://blog.csdn.net/jjjjjjabnannnan/article/details/110239351