Hadoop 开启 histotryserver

news/2024/11/25 2:51:19/

Hadoop 开启 histotryserver

Hadoop自带了一个历史服务,可以通过历史服务在web端查看已经运行完的Mapreduce作业记录,
默认情况下,Hadoop历史服务是没有启动的,需要自行启动。
启动后,在下图中点击history可跳转至历史服务查看信息。

hadoop histotryserver

配置历史服务器

配置文件mapred-site.xml

配置文件在hadoop文件夹下的etc/hadoop中。

在该配置文件中添加如下代码:

mapreduce.jobhistory.address 启动历史服务器的端口,

mapreduce.jobhistory.webapp.address 历史服务器web端的端口。

<configuration>
<property><name>mapreduce.jobhistory.address</name><value>spark01:10020</value>
</property>
<property><name>mapreduce.jobhistory.webapp.address</name><value>spark01:19888</value>
</property>
</configuration>

配置文件yarn-site.xml

配置文件在hadoop文件夹下的etc/hadoop中。

在该配置文件中添加如下代码:

yarn.log-aggregation-enable 是否开启日志聚集功能

yarn.log.server.url 日志聚集服务器地址

yarn.log-aggregation.retain-seconds 日志保留时间

</configuration>
<property><name>yarn.log-aggregation-enable</name><value>true</value>
</property>
<property><name>yarn.log.server.url</name><value>http://spark01:19888/jobhistory/logs</value>
</property>
<property><name>yarn.log-aggregation.retain-seconds</name><value>604800</value>
</property>
</configuration>

启动hadoop集群

start-all.sh

启动历史服务

在历史服务器执行以下命令

mr-jobhistory-daemon.sh start historyserver

或者

mapred --daemon start historyserver

mapred --daemon start historyserver

查看历史服务

jps

hadoop histotryserver

浏览器访问:http://spark01:19888

hadoop histotryserver

测试历史服务

上传一个测试任务,其中 /wordcount/input 中包含有一个txt文件,可以自行创建任意内容,输出到名为 /wordcount/result 的目录中。

hadoop.jar 为自己编写的 单词统计程序

hadoop jar hadoop.jar com.lihaozhe.mapreduce.wordcount.WordCountDriver

等待任务运行完成后,在浏览器查看运行情况:

hadoop histotryserve

hadoop histotryserve

hadoop histotryserve

hadoop histotryserve

在这里插入图片描述

hadoop histotryserve


http://www.ppmy.cn/news/43234.html

相关文章

C#基础学习--转换

目录 什么是转换 隐式转换 显式转换和强制转换 ​编辑 转换的类型 数字的转换 ​编辑 隐式数字转换 溢出检测上下文 显式数字转换 引用转换 隐式引用转换 显式引用转换 有效显式引用转换 装箱转换 装箱是创建副本 装箱转换 拆箱转换 用户自定义转换 用户自定义…

【C++进阶】function和bind及可变模板参数

文章目录1. function和bind1.1 function使用方法1.2 bind2. 可变模板参数2.1 可变模板参数函数2.2 可变模板参数的展开1. function和bind C中的function和bind是为了更方便地进行函数对象的封装和调用而设计的。 function是一个通用的函数对象容器&#xff0c;可以存储任意可…

Wombat:93%ChatGPT性能!无需RLHF就能对齐人类的语言模型

文 | zzy文章地址: https://arxiv.org/abs/2304.05302v1训练代码&#xff1a;https://github.com/GanjinZero/RRHF模型权重&#xff1a;https://huggingface.co/GanjinZero/wombat-7b-delta文章提出RRHF一种无须强化学习的对齐方法训练语言模型。该文章利用chatGPT或者GPT-4作为…

CAN 发展史

一、起源 1986 年 2 月 Robert Bosch 公司在 SAE 汽车工程协会 大会上介绍了一种新型的串行总线 CAN控制器局域网&#xff0c;那是 CAN 诞生的时刻。今天&#xff0c;在欧洲几乎每一辆新客车均装配有 CAN 局域网。同样&#xff0c;CAN也用于其他类型的交通工具&#xff0c;从火…

学会了selenium 模拟鼠标操作,你就可以偷懒点点点了

目录&#xff1a;导读 前言 01.ActionChains 类常用方法 02.ActionChains 类所有方法 03.ActionChains 使用步骤 04.实战 05.总结 前言 我们在做 Web 自动化的时候&#xff0c;有时候页面的元素不需要我们点击&#xff0c;值需要把鼠标移动上去就能展示各种信息。 这个…

CDH 之 Kerberos 安全认证和 Sentry 权限控制管理(一)

一、Kerberos 和 Sentry 概述 1.1 什么是 Kerberos Kerberos是一种计算机网络授权协议&#xff0c;用来在非安全网络中&#xff0c;对个人通信以安全的手段进行身份认证。这个词又指麻省理工学院为这个协议开发的一套计算机软件。软件设计上采用客户端/服务器结构&#xff0c;…

信息系统项目管理师-项目成本管理

1.过程 1.1 规划成本管理 确定如何估算、预算、管理、监督和控制项目成本的过程。 1.2 估算成本 对完成项目工作所需资源成本近似估算的过程。 1.3 制定预算 汇总所有单个活动或工作包的估算成本&#xff0c;建立一个经批准的成本基准的过程。 1.4 控制成本 监督项目状态&#…

FlowForge 使用教程 团队资源管理

前言 本篇文章结合FF的操作来给大家解释一下,FF在团队管理上都与那些资源可以操作。 团队创建 使用超管第一次登录FF平台,默认什么资源都没有,你只能先去创建一个团队才能继续往下操作。 在FF平台上,团队就代表一个租户,也是一种资源隔离的手段。 创建团队可以通过右上…