greenplum数据库核心组件:interconnect(并行查询生成,分发,协调数据节点查询)
数据引擎:postgresql
数据库架构:3节点,master+standby master +segment(mirror segment为segment提供高可用支持)。master节点故障,可以切换到standby master节点继续工作
master工作职责:接受sql请求,生成查询计划分配给所有segment,汇总结果反馈给客户端
master特色:只存储系统数据,不存储用户数据
segment:用户数据存储和数据读取计算(每个segment是一个独立的postgresql实例)
高可用的体现:master通过standby实现备份,primary segment通过mirror segment实现备份
greenplum command center是web可视化工具方便运维,数据分析可用python,详见“greenplum中文社区”
greenplum性能测试:
测试工具:gpcheckperf(数据库自带的工具)
1>磁盘io测试:测试建议,文件尺寸按照主机ram的2倍计算,以便绕过内存缓存
2>内存带宽测试:测量无cpu计算情况下,内存带宽低于cpu理论带宽,会导致cpu花费等待时间长
3>网络带宽测试:测试网络性能以及greenplum数据库interconnect组件性能
greenplum基本数据类型:数值,货币,字符,日期/时间,布尔类型