发展历程: 单机数据系统: localFS单机存储、SQL单机计算 分布式系统: 扩展数据存储Hadoop:基于磁盘:Hadoop核心【HDFS分布式文件系统、MapReduce分布式计算框架、资源管理和任务调度】+SQL on Hadoop【Hive、Impala、Presto】: 扩展数据计算spark:基于内存:spark核心+sparkSQL+sparkStreaming+MLlib+Graphx