【2023Hadoop大数据技术应用期末复习】填空题题型整理

news/2024/10/22 16:45:16/
  1. 大数据的 4V 特征包含()()()()

    答案:大量、多样、高速、价值
    
  2. Hadoop 三大组件包含()()()

    答案:HDFS、MapReduce、Yarn
    
  3. Hadoop2.x 版本中的 HDFS 是由()()()组成

    答案:NameNode、DataNode、Secondary NameNode
    
  4. Hadoop 发行版本分为

    答案:开源社区版、商业版
    
  5. 目前 Hadoop 发布的版本主要有()()()

    答案:Hadoop1.x、Hadoop2.x、Hadoop3.x
    
  6. Hadoop 集群部署方式分别是()()和()

    答案:独立模式、伪分布模式、完全分布模式
    
  7. 加载环境变量配置文件需要使用()命令

    答案:source /etc/profile
    
  8. 格式化 HDFS 集群命令是()

    答案:hadoop namenode -format
    
  9. 脚本一键启动 Hadoop 集群服务命令是()

    答案:start-all.sh
    
  10. Hadoop 默认开设 HDFS 文件系统端口号()和监控 Yarn 集群端口号()

    答案:50070、8088
    
  11. ()用于维护文件系统名称并管理客户端对文件的访问,()存储真实的数据块

    答案:NameNode、DataNode
    
  12. NameNode 与 DataNode 通过()机制互相通信

    答案:心跳检测
    
  13. NameNode 以元数据维护着()()文件

    答案:fsimage、EditLog
    
  14. 在 MapReduce 中,()阶段负责将任务分解,()阶段将任务合并

    答案:Map、Reduce
    
  15. MapReduce 工作流程分为()()()()()()

    答案:分片、格式化数据源、执行MapTask、执行Shuffle过程、执行ReduceTask、写入文件
    
  16. Partitioner 组件的目的是()

    答案:将key均匀分布在 ReduceTask 上
    
  17. Zookeeper 集群主要有()()()三种角色

    答案:Leader、Follower、Observer
    
  18. Znode有两种节点,分别是()()

    答案:永久节点、临时节点
    
  19. Zookeeper引入()机制实现分布式的通知功能

    答案:Watch
    
  20. Yarn 的核心组件包含()()()

    答案:ResourceManager、NodeManager、ApplicationMaster
    
  21. ResourceManager 内部包含了两个组件,分别是()()

    答案:调度器、应用程序管理器
    
  22. 数据仓库是面向()()()和时变的数据集合,用于支持管理决策

    答案:主题的、集成的、非易失的
    
  23. Hive 默认元数据存储在()数据库中

    答案:Derby
    
  24. Hive建表时设置分割字符命令()

    答案:row format delimited fields terminated by char
    
  25. Hive查询语句 select ceil(2.34) 输出内容是()

    答案:3
    
  26. Hive创建桶表关键字(),且Hive默认分桶数量是()。

    答案:clustered by、 -1
    
  27. Flume 分为两个版本,分别是()()

    答案:Flume-og、Flume-ng
    
  28. Flume的核心是把数据从数据源通过()收集过来,再将收集的数据通过()汇集到指定的()

    答案:数据采集器、缓冲通道、接收器
    
  29. Flume采用三层架构,分别为()()(),每一层均可以水平扩展

    答案:agent、collector、storage
    
  30. Flume的负载均衡接收器处理器支持使用()()机制进行流量分配,其默认选择机制为()

    答案:轮询、随机、轮询
    
  31. Azkaban是由Linkedin公司开源的一个(),用于在一个工作流内以一个特定的顺序运行一组工作和流程。

    答案:批量工作流任务调度器
    
  32. Azkaban定义了一种()格式来建立任务之间的依赖关系,并提供一个易于使用的()维护和跟踪工作流。

    答案:KV文件、UI界面
    
  33. Azkaban工作流管理器的特点是所有的任务资源文件都需要()上传

    答案:压缩
    
  34. Azkaban工作流管理器由三个核心部分组成,具体分别是()()()

    答案:Relational Database、AzkabanWebServer、AzkabanExecutorServer
    
  35. Azkaban提供三种部署模式:轻量级的()重量级()的和()

    答案:独立服务器模式、双服务器模式、分布多执行器模式
    
  36. .Sqoop主要用于在()和()之间进行传输数据

    答案:Hadoop、关系型数据库
    
  37. Sqoop底层利用()技术以()方式加快了数据传输速度,并且具有较好的容错性功能

    答案:MapReduce、批处理
    
  38. 从数据库导入HDFS时,指定以制表符作为字段分隔符参数是()

    答案:--fields-terminated-by '\t'
    

http://www.ppmy.cn/news/1287395.html

相关文章

浅谈冯诺依曼体系和操作系统

🌎冯诺依曼体系结构 文章目录 冯诺依曼体系结构 认识冯诺依曼体系结构       硬件分类       各个硬件的简单认识         输入输出设备         中央处理器         存储器 关于内存 对冯诺依曼体系的理解 操作系统 操作系统…

【K8S 二进制部署】部署单Master Kurbernetes集群

目录 一、基本架构和系统初始化 1、集群架构: 2、操作系统初始化配置: 2.1、关闭防火墙和安全机制: 2.2、关闭swap 2.3、根据规划设置主机名 2.4、三台主机全部互相映射 2.5、调整内核参数 3、时间同步(所有节点时间必须同…

如何设置Android Studio绘制布局时的视图--新手建议收藏!

目录 前言 一、总体步骤 二、详细步骤 三、总结 四、更多资源 前言 在Android Studio中,你可以使用布局编辑器来绘制应用程序的用户界面。布局编辑器提供了一个可视化界面,可让你以所见即所得的方式布局和设计应用程序的视图。 一、总体步骤 打开…

【软件工程】融通未来的工艺:深度解析统一过程在软件开发中的角色

🍎个人博客:个人主页 🏆个人专栏: 软件工程 ⛳️ 功不唐捐,玉汝于成 目录 前言: 正文 统一过程(Unified Process) 介绍和解释: 应用: 优缺点&#xf…

VMware虚拟机之文件夹共享jdk和tomcat安装防火墙设置

目录 一. 配置文件夹共享功能 1.1 为什么需要配置文件夹共享功能 1.2 配置文件共享功能 1.3 普通共享和高级共享的区别 1.3.1 普通共享 1.3.2 高级共享 1.3.3 总结 二. jdk的配置 2.1 安装jdk 2.2 配置jdk的环境配置jdk 2.3 配置成功 三. TomCat的配置 四. 防火墙设置 4.1…

IP地址的四大类型:动态IP、固定IP、实体IP、虚拟IP的区别与应用

在网络通信中,IP地址是设备在互联网上唯一标识的关键元素。动态IP、固定IP、实体IP和虚拟IP是四种不同类型的IP地址,它们各自具有独特的特点和应用场景。 1. 动态IP地址: 动态IP地址是由Internet Service Provider(ISP&#xff…

JMeter逻辑控制器之While控制器

JMeter逻辑控制器之While控制器 1. 背景2.目的3. 介绍4.While示例4.1 添加While控制器4.2 While控制器面板4.3 While控制器添加请求4.3 While控制器应用场景 1. 背景 存在一些使用场景,比如:某个请求必须等待上一个请求正确响应后才能开始执行。或者&…

【Java开发岗面试】八股文—Java基础集合多线程

声明: 背景:本人为24届双非硕校招生,已经完整经历了一次秋招,拿到了三个offer。本专题旨在分享自己的一些Java开发岗面试经验(主要是校招),包括我自己总结的八股文、算法、项目介绍、HR面和面试…