监控
智能物理拓扑
物理拓扑图主要以服务器为视角展示集群组件与服务器的所属关系,同时可查看服务器资源的使用情况以及各集群组件服务运行状态。使用前需保证为集群服务器配置了可用的SSH连接信息,否则只能查看当前服务器与集群组件的所属关系,无法查看服务器与组件程序的状态。
容灾模式说明:集群开启容灾模式时,智能物理拓扑图相关逻辑说明请结合跨机房容灾部署文档中的智能物理拓扑图章节。
- 智能物理拓扑总览
-
服务器健康状态:状态有正常、预警、故障,统计图中分别对应绿色、橙色、红色显示。服务器故障原因有:服务器SSH连接信息有误、服务器网络连接异常、服务器无法正常连接;服务器预警原因有:服务器资源使用参数值达到“设置-监控面板设置-计算节点/其他服务器资源设置”的阈值。
-
服务程序总数:“配置->服务器”页面显示的“关联服务程序”个数总和。
-
服务程序类型:计算节点、存储节点、配置库、keepalived(主备模式集群)、LVS(多节点模式集群)。
-
服务程序健康状态:对应的服务程序运行状态。计算节点有:故障(无法连接)、预警(超出阈值)、正常(服务正常运行)。其他服务程序只有正常(正常运行)、故障(运行异常)两种状态。鼠标移入故障或异常状态的区域可查看详情信息。
- 智能物理拓扑图页面
页面说明:
-
显示服务器与服务程序关系。服务器以方块表示,每一层代表一个服务程序类型,最底层右下角显示服务器IP。正常、预警、故障,分别对应蓝色、橙色、红色方块显示。无法监控的服务器,透明显示
-
服务器上对应的服务程序全部显示,以层层叠加的方式显示。服务程序类型及个数与总览中显示一致
-
在“配置->服务器”功能页面中未配置SSH连接信息或未开启监控的服务器在图中显示为透明,点击服务器弹出对应“SSH未配置或服务器未开启监控”提示
-
在“配置->服务器”功能页面中已配置SSH,但后期修改变更导致SSH信息不可用的服务器在图中显示为透明,点击服务器弹出对应“SSH信息不可用”提示
- 服务器详情面板
服务器资源详情:
-
CPU使用率:显示当前CPU的使用率情况,鼠标移入显示具体详情,若有超出阈值则在提示中出现预警信息。
-
内存使用率:展示当前内存情况,鼠标移入显示具体详情:(总内存、已用内存、剩余内存、内存使用率);内存统一用GB为单位显示。内存量若有小数则精确到小数点后两位。
-
磁盘空间使用率:显示对应挂载点的总磁盘空间使用率情况,鼠标移入显示具体详情:(挂载点名称、磁盘空间总量、已用磁盘空间、剩余内存、磁盘空间使用率)统一用GB为单位显示,可切换底部挂载点展示对应挂载点的监控数据。
-
流量:显示当前网络进流量与网络出流量情况,鼠标移入显示具体详情,单位根据实际情况显示KBps、MBps。
-
服务程序详情:
显示该服务器中具体安装的组件信息,包括组件当前的状态情况。