基本介绍 特点(高可靠、高性能、面向列、可伸缩) 非关系型数据库大数据实时处理 表规模达数十亿行及数百万列读、写访问可实时分布式存储系统 HDFS(Hadoop Distributed File System)文件存储ZooKeeper作为协同服务列存储 优点:有利于单列数据查询缺点:整行读取时效率较慢,需要多次IO操作与RDB(关系型数据库区别) 索引 多个索引(联合索引)行键(HBase)数据维护 当前值替换原值新增-版本号(HBase)可伸缩性 集群、分片、分库分表增加HRigionServer节点(HBase)使用场景 场景分析 海量数据(TB、PB)不需要事务特性处理(ACID)高吞吐量在海量数据中实现随机读取需要很好伸缩能力需要同时处理结构化和非结构化的数据