大数据框架之Hadoop:入门(五)Hadoop编译源码(面试重点)

news/2024/12/29 1:53:55/

5.1 前期准备工作

1.CentOS联网

配置CentOS能连接外网。Linux虚拟机ping www.baidu.com 是畅通的

注意:采用root角色编译,减少文件夹权限出现问题

2.jar包准备(hadoop源码、JDK8、maven、ant 、protobuf)

(1)hadoop-2.7.7-src.tar.gz

(2)jdk-8u201-linux-x64.tar.gz

(3)apache-ant-1.9.9-bin.tar.gz(build工具,打包用的)

(4)apache-maven-3.0.5-bin.tar.gz

(5)protobuf-2.5.0.tar.gz(序列化的框架)

5.2 jar包安装

注意:所有操作必须在root用户下完成

1.JDK解压、配置环境变量 JAVA_HOME和PATH,验证java-version(如下都需要验证是否配置成功)

[root@hdp101 software] # tar -zxf jdk-8u201-linux-x64.tar.gz -C /opt/module/
[root@hdp101 software] # mvopt/module/jdk1.8.0_201 /opt/module/java[root@hdp101 software]# vi /etc/profile
#JAVA_HOME:
export JAVA_HOME=/opt/module/java
export PATH=$PATH:$JAVA_HOME/bin[root@hdp101 software]# source /etc/profile

验证命令:java -version

2.Maven解压、配置 MAVEN_HOME和PATH

[root@hdp101 software]# tar -zxvf apache-maven-3.0.5-bin.tar.gz -C /opt/module/
[root@hdp101 software]# /opt/module/apache-maven-3.0.5 /opt/module/maven[root@hdp101 maven]# vi conf/settings.xml<mirrors><!-- mirror| Specifies a repository mirror site to use instead of a given repository. The repository that| this mirror serves has an ID that matches the mirrorOf element of this mirror. IDs are used| for inheritance and direct lookup purposes, and must be unique across the set of mirrors.|
<mirror><id>mirrorId</id><mirrorOf>repositoryId</mirrorOf><name>Human Readable Name for this Mirror.</name><url>http://my.repository.com/repo/path</url></mirror>--><mirror><id>nexus-aliyun</id><mirrorOf>central</mirrorOf><name>Nexus aliyun</name><url>http://maven.aliyun.com/nexus/content/groups/public</url></mirror>
</mirrors>[root@hdp101 maven]# vi /etc/profile
#MAVEN_HOME
export MAVEN_HOME=/opt/module/maven
export PATH=$PATH:$MAVEN_HOME/bin[root@hdp101 software]#source /etc/profile

验证命令:mvn -version

3.ant解压、配置 ANT _HOME和PATH

[root@hdp101 software]# tar -zxvf apache-ant-1.9.9-bin.tar.gz -C /opt/module/
[root@hdp101 software]# /opt/module/apache-ant-1.9.9 /opt/module/ant[root@hdp101 ant]# vi /etc/profile
#ANT_HOME
export ANT_HOME=/opt/module/ant
export PATH=$PATH:$ANT_HOME/bin[root@hdp101 software]#source /etc/profile

验证命令:ant -version

4.安装 glibc-headers 和 g++ 命令如下

[root@hdp101 ant]# yum install glibc-headers
[root@hdp101 ant]# yum install gcc-c++

5.安装make和cmake

[root@hdp101 ant]# yum install make
[root@hdp101 ant]# yum install cmake

6.解压protobuf ,进入到解压后protobuf主目录,/opt/module/protobuf-2.5.0,然后相继执行命令

[root@hdp101 software]# tar -zxvf protobuf-2.5.0.tar.gz -C /opt/module/
[root@hdp101 opt]# cd /opt/module/protobuf-2.5.0/[root@hdp101 protobuf-2.5.0]#./configure 
[root@hdp101 protobuf-2.5.0]# make 
[root@hdp101 protobuf-2.5.0]# make check 
[root@hdp101 protobuf-2.5.0]# make install 
[root@hdp101 protobuf-2.5.0]# ldconfig [root@hdp101 hadoop-dist]# vi /etc/profile
#LD_LIBRARY_PATH
export LD_LIBRARY_PATH=/opt/module/protobuf-2.5.0
export PATH=$PATH:$LD_LIBRARY_PATH[root@hdp101 software]#source /etc/profile

验证命令:protoc --version

7.安装openssl库

[root@hdp101 software]# yum install openssl-devel

8.安装 ncurses-devel库

[root@hdp101 software]# yum install ncurses-devel

到此,编译工具安装基本完成。

5.3 编译源码

1.解压源码到/opt/目录

[root@hdp101 software]# tar -zxvf hadoop-2.7.7-src.tar.gz -C /opt/

2.进入到hadoop源码主目录

[root@hdp101 hadoop-2.7.7-src]# pwd
/opt/hadoop-2.7.7-src

3.通过maven执行编译命令

[root@hdp101 hadoop-2.7.7-src]#mvn package -Pdist,native -DskipTests -Dtar

等待时间30分钟左右,最终成功是全部SUCCESS,如下图所示。

image-20230113215517949

4.成功的64位hadoop包在 /opt/hadoop-2.7.7-src/hadoop-dist/target

[root@hdp101 target]# pwd
/opt/hadoop-2.7.7-src/hadoop-dist/target

5.编译源码过程中常见的问题及解决方案

(1)MAVEN install时候JVM内存溢出

处理方式:在环境配置文件和maven的执行文件均可调整MAVEN_OPT的heap大小。(详情查阅MAVEN 编译 JVM调优问题,如:http://outofmemory.cn/code-snippet/12652/maven-outofmemoryerror-method)

(2)编译期间maven报错。可能网络阻塞问题导致依赖库下载不完整导致,多次执行命令(一次通过比较难):

[root@hdp101 hadoop-2.7.7-src]#mvn package -Pdist,nativeN -DskipTests -Dtar

(3)报ant、protobuf等错误,插件下载未完整或者插件版本问题,最开始链接有较多特殊情况,同时推荐2.7.0版本的问题汇总帖子 http://www.tuicool.com/articles/IBn63qf


http://www.ppmy.cn/news/24337.html

相关文章

PyCharm+Docker:打造最舒适的深度学习炼丹炉

九、PyCharmDocker&#xff1a;打造最舒适的深度学习炼丹炉 安装docker&#xff1a; 如何在 Ubuntu 22.04 LTS 中安装 Docker 和 Docker Compose https://zhuanlan.zhihu.com/p/547169542 修改Linux硬盘卷标&#xff1a; ntfs文件系统&#xff1a;https://blog.csdn.net/n…

c#小笔记本-基础

c#基本知识一.基础操作1.打印-writeline,write2.输入-readline,readkey二.变量1.折叠代码-#region&#xff0c;#endregion2.变量类型&#xff08;在c语言变量类型上新增的&#xff09;三.常量-const四.转义字符五.显示转换1.括号强转-低精度装高精度2.parse法-作用于字符串3.co…

Ruby 发送邮件 - SMTP

SMTP&#xff08;Simple Mail Transfer Protocol&#xff09;即简单邮件传输协议,它是一组用于由源地址到目的地址传送邮件的规则&#xff0c;由它来控制信件的中转方式。 Ruby提供了 Net::SMTP 来发送邮件&#xff0c;并提供了两个方法 new 和 start: new 方法有两个参数&am…

软考高级信息系统项目管理师系列之九:项目范围管理

软考高级信息系统项目管理师系列之九:项目范围管理 一、范围管理输入、输出、工具和技术表二、范围管理概述三、规划范围管理四、收集需求1.收集需求:2.需求分类3.收集需求的工具与技术4.收集需求过程主要输出5.需求文件内容6.需求管理7.可跟踪性8.双向可跟踪性9.需求跟踪矩阵…

【Python】多线程与多进程学习笔记

本文是一篇学习笔记&#xff0c;学习内容主要来源于莫凡python的文档&#xff1a;https://mofanpy.com/tutorials/python-basic/threading/thread 多线程 线程基本结构 开启子线程的简单方式如下&#xff1a; import threadingdef thread_job():print(This is a thread of %…

移动测试相关

一、环境搭建 准备工作&#xff1a; &#xff08;python、pycharm安装配置好&#xff09; 1、Java SDK 安装配置 Java Downloads | Oracle 下载安装后配置系统环境变量&#xff1a;JAVA_HOME&#xff08;jdk根目录路径&#xff09;和path&#xff08;jdk根目录下的bin目录路径…

回流与重绘

触发回流与重绘条件&#x1f449;回流当渲染树中部分或者全部元素的尺寸、结构或者属性发生变化时&#xff0c;浏览器会重新渲染部分或者全部文档的过程就称为 回流。引起回流原因1.页面的首次渲染2.浏览器的窗口大小发生变化3.元素的内容发生变化4.元素的尺寸或者位置发生变化…

Linux系统之部署企业内部静态导航页

Linux系统之部署企业内部静态导航页 一、本次实践目的二、检查本地系统环境1.检查系统版本2.检查内核版本三、下载静态导航页资源包1.创建下载目录2.下载资源包四、安装apache服务1.安装httpd2.复制网页文件3.重启httpd服务4.检查httpd服务状态五、访问导航页六、修改导航页网站…