hadoop3.x 新特性

embedded/2024/11/19 6:25:43/

hadoop3.x 新特性

FeaturesHadoop 2.xHadoop 3.x
Minimum Required Java VersionJDK 6 and above.JDK 8 is the minimum runtime version of JAVA required to run Hadoop 3.x as many dependency library files have been used from JDK 8.
Fault ToleranceFault Tolerance is handled through replication leading to storage and network bandwidth overhead.(3个副本)Support for Erasure Coding(纠错码) in HDFS improves fault tolerance (0.5纠错码+1数据 = 1.5倍磁盘占用)
Storage SchemeFollows a 3x Replication Scheme for data recovery leading to 200% storage overhead. For instance, if there are 8 data blocks then a total of 24 blocks will occupy the storage space because of the 3x replication scheme.Storage overhead in Hadoop 3.0 is reduced to 50% with support for Erasure Coding. In this case, if here are 8 data blocks then a total of only 12 blocks will occupy the storage space.
Change in Port NumbersHadoop HDFS NameNode -8020 Hadoop HDFS DataNode -50010 Secondary NameNode HTTP -50091Hadoop HDFS NameNode -9820 Hadoop HDFS DataNode -9866 Secondary NameNode HTTP -9869
YARN Timeline ServiceYARN timeline service introduced in Hadoop 2.0 has some scalability issues.YARN Timeline service has been enhanced with ATS v2 which improves the scalability and reliability.
Intra DataNode BalancingHDFS Balancer in Hadoop 2.0 caused skew within a DataNode because of addition or replacement of disks.Intra DataNode Balancing has been introduced in Hadoop 3.0 to address the intra-DataNode skews which occur when disks are added or replaced.
Number of NameNodesHadoop 2.0 introduced a secondary namenode as standby.(一主一备)Hadoop 3.0 supports 2 or more NameNodes.(一主多备)
Heap SizeIn Hadoop 2.0 , for Java and Hadoop tasks, the heap size needs to be set through two similar properties mapreduce.{map,reduce}.java. Opts and mapreduce.{map,reduce}.memory.mbIn Hadoop 3.0, heap size or mapreduce.*.memory.mb is derived automatically.
hdfs HA 逻辑
  1. 增加用于主备之间信息共享推送的 JournalNode
  2. 增加用于选主决策的 zookeeper 集群:ha.zookeeper.quorum 配置
  3. 增加用于监控同机器上的 namenode,试图选举,切换本地 namenode 的 active,standby 状态的zookeeper failover controller(zkfc)进程:QuorumPeerMain

http://www.ppmy.cn/embedded/138707.html

相关文章

微服务day11-微服务面试

分布式事务 CAP和BASE AT模式的脏写问题 TCC模式 最大努力通知 注册中心 环境隔离 分级模型 Eureka与Nacos 远程调用 切换负载均衡算法 服务保护 线程隔离 滑动窗口算法 漏桶算法 令牌桶算法

【QT常用技术讲解】QSettings把中文输入到配置文件

前言 在 QT 中,使用 QSettings 时,默认是将字符串以 Unicode 格式存储,而不是以 UTF-8 编码直接写入配置文件。因为涉及到配置文件,有些时候,配置信息由界面端进行写操作,而后台服务进程进行读取并处理&…

Maven的下载安装及配置

一、下载Maven 1、访问Maven官网: 打开浏览器,访问Maven的官方网站:Download Apache Maven – Maven 2、选择Maven版本: 在下载页面上,选择适合您操作系统的Maven版本。通常,Maven提供二进制zip归档和tar…

Eclipse 任务管理

Eclipse 任务管理 Eclipse 是一个广泛使用的集成开发环境(IDE),它提供了强大的任务管理功能,帮助开发人员有效地组织和管理他们的工作。本文将详细介绍 Eclipse 任务管理系统的功能和使用方法,以及如何利用它来提高开…

npm上传自己封装的插件(vue+vite)

一、npm账号及发包删包等命令 若没有账号,可在npm官网:https://www.npmjs.com/login 进行注册。 在当前项目根目录下打开终端命令窗口,常见命令如下: 1、登录命令:npm login(不用每次都重新登录&#xff0…

已有账号,重装系统激活office后发现没有ppt,word,excel等

有时候重装系统后,登录windows结果右键没有word,excel等 点击进入office 进入右边的账户 找到设备和订阅 直接下载office 安装后就会出现了

matlab 读取csv

需要跳过第一行表头等信息 1、读取整个文件 csvread(FILENAME)%文件路径 文件名2、指定起始位置 csvread(FILENAME, R, C)%从文件的第R行和第C列开始读取数据 逗号分开3、指定数据范围 csvread(FILENAME, R, C, [R1 C1 R2 C2])%读取从(R1, C1)到(R2, C2)范围内的数据注意&am…

使用 VS Code 远程连接时解决 OpenSSL 版本不匹配及权限问题

在使用 VS Code 通过 SSH 远程连接服务器时,我遇到了两个主要问题,分别是 OpenSSL 版本不匹配和 SSH 私钥文件权限不正确导致连接失败。经过一番尝试,成功解决了这些问题。本文将详细记录解决过程,供大家参考。 问题描述 OpenSSL…