Hadoop•用Web UI查看Hadoop状态词频统计

devtools/2025/1/19 23:30:23/

听说这里是目录哦

  • 通过Web UI查看Hadoop运行状态🐇
    • 一、关闭防火墙
    • 二、在物理计算机添加集群的IP映射
    • 三、启动集群
    • 四、进入HDFS的Web UI
  • 词频统计🦩
    • 1、准备文本数据
    • 2、在HDFS创建目录
    • 3、上传文件
    • 4、查看文件是否上传成功
    • 5、运行MapReduce程序
    • 6、查看MapReduce程序运行状态
    • 7、查看统计结果
  • 能量站😚

通过Web UI查看Hadoop运行状态🐇

一、关闭防火墙

在集群中每个虚拟机内执行
systemctl stop firewalld 【关闭防火墙】
systemctl disable firewalld 【禁止防火墙开机启动】

二、在物理计算机添加集群的IP映射

在这里插入图片描述

hosts文件末尾添加【解决HDFS网页无法查看文件
这是我的,格式就是IP 虚拟机名

在这里插入图片描述
刷新DNS缓存:以管理员身份运行命令提示符,在命令提示符中输入ipconfig /flushdns

三、启动集群

看Hadoop•搭建完全分布式集群目录中的启动Hadoop

四、进入HDFS的Web UI

在浏览器输入IP:9870,如192.168.88.151:9870192.168.88.151是我的主机IP,HDFS的Web UI端口一般都是9870

在这里插入图片描述

词频统计🦩

1、准备文本数据

在哪个目录下创建,路径就在哪。切到需要的目录下哦~【记住路径!!!】
命令用touch word.txt或者vi word.txt都行(创建一个名为word.txt文件)。
文件内要编写的内容如下图:
在这里插入图片描述

2、在HDFS创建目录

用命令hdfs dfs -mkdir -p /wordcount/input在HDFS创建/wordcount/input用于存放文件word.txt

3、上传文件

用命令hdfs dfs -put /export/data/word.txt /wordcount/input把位于/export/data/word.txt上传到HDFS的/wordcount/input

4、查看文件是否上传成功

进入HDFS的Web UI输入路径/wordcount/input,如果看到该目录下有word.txt,那word.txt就上传成功了

5、运行MapReduce程序

在主机node1进入/export/servers/hadoop-3.1.4/share/hadoop/mapreduce目录下执行ll命令查看Hadoop提供的MapReduce程序hadoop-mapreduce-examples-3.1.4.jar。在该程序所在目录下执行命令hadoop jar hadoop-mapreduce-examples-3.1.4.jar wordcount /wordcount/input wordcount/output运行该程序即可实现词频统计,该命令中hadoop jar指定运行的MapReduce程序,第一个wordcount是程序名称【执行操作要用的】,/wordcount/input是要计算的文件word.txt所在的目录,wordcount/output是统计结果输出的目录【该目录会自动创建,所以不能提前创建】。注意,这里使用的都是HDFS文件系统的目录。

在这里插入图片描述

6、查看MapReduce程序运行状态

使用浏览器访问YARN在浏览器输入IP:8088,如192.168.88.151:8088192.168.88.151是我的主机IP,YARN的Web UI端口一般都是8088

在这里插入图片描述

7、查看统计结果

进入HDFS的Web UI,结果存放在wordcount/output目录,输入路径,然后Go!就行了。

在这里插入图片描述

🐇🐇🐇我是分割线
就是在物理计算机添加集群的IP映射
在这里插入图片描述

能量站😚

祝有爱者有爱,无爱者自由。
请添加图片描述

❤️谢谢你为自己努力❤️


http://www.ppmy.cn/devtools/151946.html

相关文章

ES6中有哪些作用域

在ES6(ECMAScript 2015)中,作用域(Scope)是指变量、函数和对象在代码中的可访问范围。ES6 引入了新的作用域规则,除了传统的全局作用域和函数作用域外,还新增了块级作用域。以下是 ES6 中的主要…

STM32 HAL库函数入门指南:从原理到实践

1 STM32 HAL库概述 STM32 HAL(Hardware Abstraction Layer)库是ST公司专门为STM32系列微控制器开发的一套硬件抽象层函数库。它的核心设计理念是在应用层与硬件层之间建立一个抽象层,这个抽象层屏蔽了底层硬件的具体实现细节,为开发者提供了一套统一的、…

vue2:实现上下两栏布局,可拖拽改变高度

要拖拽改变两栏高度,那么总高度要确定,在拖拽的过程中,实时根据光标位置计算两栏高度,所以: 1、最外层有一个box, 高度是屏幕高度screenHeight; 2、该值在页面挂载时获取初始值(window.innerHeight-100),这里减少100,因为窗口上面有工具栏; 3、监听窗口resize事件…

Linux安装Docker教程(详解)

如果想要系统学习docker,建议进入官方文档中学习:docker官方文档 一. 基本概念 Docker Desktop 和 Docker Engine 有什么区别? Docker Desktop for Linux 提供用户友好的图形界面,可简化容器和服务的管理。它包括 Docker Engine&#xff0c…

力扣动态规划-2【算法学习day.96】

前言 ###我做这类文章一个重要的目的还是给正在学习的大家提供方向(例如想要掌握基础用法,该刷哪些题?建议灵神的题单和代码随想录)和记录自己的学习过程,我的解析也不会做的非常详细,只会提供思路和一些关…

NVIDIA视频编解码

开源了两个项目:英伟达显卡视频编解码、jetson视频编解码。都是基于官方SDK进行的封装,由于官方自带的demo晦涩难懂并且每块都是独立的,我对SDK进行二次封装并形成了一套较为完整的视频编解码流程,调用简单,有完整的测…

MySQL的不同SQL模式导致行为不同?

现象: 我在两个mysql库都有相同定义的表,其中一个字段是varchar(1200)。当我都对这个表进行insert操作,而且超过此字段的规定长度(此处是1200),这两库的行为是不一样的:库B是直接报错too long&…

【面试题】Spring/SpringBoot部分[2025/1/13 ~ 2025/1/19]

Spring/SpringBoot部分[2025/1/13 ~ 2025/1/19] 8. 什么是 Spring IOC/Di?9. Spring AOP默认用的是什么动态代理,两者的区别?10. 什么是 AOP?11. 看过源码吗?说下 Spring 由哪些重要的模块组成?12. 什么是循…