1.HDFS命令行解释 2.HDFS命令行常用操作 3.HDFS各角色职责介绍 SecondaryNameNode不能代替NameNode,只起辅助作用 4.HDFS写数据流程 HDFS写数据流程 即有一份复制成功就算写入完成 5.MapReduce介绍 MR缺点: 实时计算性能差不能进行流式计算 6.Map阶段执行过程 7.Reduce执行过程 一般默认只有一个ReduceTask(和前面Map阶段的分区可能有关),不同的Key也会被同一个ReduceTask处理,只不过处理之前会按照key进行分组,相同的key会调用一次reduce方法 8.Shuffle机制