【Hadoop】- YARN架构[7]

devtools/2024/11/30 0:41:28/

前言

Yarn架构是一个用于管理和调度Hadoop集群资源的系统。它是Hadoop生态系统的一部分,主要用于解决Hadoop中的资源管理问题。

通过使用Yarn架构,Hadoop集群中的不同应用程序可以共享集群资源,并根据需要动态分配和回收资源。这种灵活的资源管理能力可以提高集群的利用率和性能。

一、核心架构

1、YARN架构

  • YARN,主从架构,有2个角色
    • 主(Master)角色:ResourceManager
    • 从(Slave)角色:NodeManager

ResourceManager:整个集群的资源调度者,负责协调调度各个程序所需的资源

NodeManager:单个服务器的资源调度者,负责调度单个服务器上的资源提供给应用程序使用

那是如何实现服务器上精准分配如上的硬件资源呢?

开辟的空间,称之为:容器

2、容器(Container)

NodeManager预先占用这一部分资源,然后将这一部分资源提供给程序使用

  • NodeManager在服务器上构建一个容器(提前占用资源,类似集装箱的概念)
  • 然后将容器的资源提供给程序使用
  • 程序运行在容器(集装箱)内,无法突破容器的资源限制

二、辅助架构

  • 代理服务器(ProxyServer):Web Application Proxy Web 应用程序代理
  • 历史服务器(JobHistoryServer):应用程序历史信息记录服务

1、Web应用代理(Web Application Proxy)

代理服务器,即Web应用代理是YARN的一部分。默认情况下,它将作为资源管理器(RM)的一部分运行,但是可以配置为在独立模式下运行。使用代理的原因是为了减少通过YARN进行基于网络的攻击的可能性。

这是因为YARN在运行时提供一个WEB UI站点(同HDFS的WEB UI站点一样)可供用户在浏览器内查看YARN的运行信息。

对外提供WEB站点会有安全性问题,而代理服务器的功能就是最大限度保障对WEB UI 的访问是安全的。比如:

  • 警告用户正在访问一个不受信任的站点
  • 剥夺用户访问的Cookie等

开启代理服务器,可以提高YARN在开放网络中的安全性(但不是绝对安全,只能是辅助提高一些)

2、JobHistoryServer历史服务器

历史服务器,记录历史运行的程序的信息以及生产的日志并提供WEB UI 站点供用户使用浏览器查看

每台服务器里的每个容器都有运行日志,将运行日志统一收集到HDFS,由历史服务器托管为WEB UI供用户在浏览器统一查看

JobHistoryServer历史服务器功能:

  • 提供WEB UI 站点,供用户在浏览器上查看程序日志
  • 可以保留历史数据,随时查看历史运行程序信息

web应用代理与历史服务器都需要配置,详细的配置和启动可以阅读部署YARN集群


http://www.ppmy.cn/devtools/7724.html

相关文章

鸿蒙OpenHarmony【轻量系统编写“Hello World”程序】 (基于Hi3861开发板)

编写“Hello World”程序 下方将通过修改源码的方式展示如何编写简单程序,输出“Hello world”。请在下载的源码目录中进行下述操作。 前提条件 已参考鸿蒙开发指导文档:gitee.com/li-shizhen-skin/harmony-os/blob/master/README.md点击或者复制转到…

【java毕业设计】 基于Spring Boot+mysql的社区团购系统设计与实现(程序源码)-社区团购系统

基于Spring Bootmysql的社区团购系统设计与实现(程序源码毕业论文) 大家好,今天给大家介绍基于Spring Bootmysql的社区团购系统设计与实现,本论文只截取部分文章重点,文章末尾附有本毕业设计完整源码及论文的获取方式。…

面试高频:HTTPS 通信流程

更多大厂面试内容可见 -> http://11come.cn 面试高频:HTTPS 通信流程 HTTPS 的加密流程 接下来说一下 HTTPS 协议是如何进行通信的: HTTPS 通信使用的 对称加密 非对称加密 两者结合的算法 HTTPS 通信时,会先使用 非对称加密 让通信双…

【融合ChatGPT等AI模型】Python-GEE遥感云大数据分析、管理与可视化及多领域应用

随着航空、航天、近地空间遥感平台的持续发展,遥感技术近年来取得显著进步。遥感数据的空间、时间、光谱分辨率及数据量均大幅提升,呈现出大数据特征。这为相关研究带来了新机遇,但同时也带来巨大挑战。传统的工作站和服务器已无法满足大区域…

【高阶数据结构】并查集 -- 详解

一、并查集的原理 1、并查集的本质和概念 (1)本质 并查集的本质:森林。 (2)概念 在一些应用问题中,需要将 n 个不同的元素划分成一些不相交的集合。 开始时,每个元素自成一个单元素集合&…

Python学习入门

学习 Python 是一个很好的选择,因为它是一种简单易学、功能强大且应用广泛的编程语言。下面是一个简单的 Python 学习入门指南,希望能帮助你开始学习 Python 编程: 1. 安装 Python 首先,你需要在你的计算机上安装 Python 解释器…

设计模式学习(五)——《大话设计模式》

文章目录 设计模式学习(五)——《大话设计模式》UML类图主要组成元素绘制UML类图的步骤如何绘制好UML类图确定类定义关系使用标准符号添加注释工具选择复审与优化求反馈 UML类图和设计模式的关系根据设计模式绘制UML类…

《Linux运维总结:Kylin V10+ARM架构CPU基于docker-compose一键离线部署redis6.2.8之容器版哨兵集群》

总结:整理不易,如果对你有帮助,可否点赞关注一下? 更多详细内容请参考:《Linux运维篇:Linux系统运维指南》 一、部署背景 由于业务系统的特殊性,我们需要面向不通的客户安装我们的业务系统&…