【监控】夜莺监控系统各环节资源压力分析

devtools/2024/12/25 21:45:59/

最近研究运维/主机监控/AIOps/容灾备份系统,现分析夜莺监控系统各个环节的资源压力对比:

1. Categraf (采集端)

资源类型    典型消耗    压力点
--------------------------------
内存       30-50MB     • 采集项过多时内存上升
CPU        1-5%        • 采集频率过高
磁盘IO     很少        • 主要是日志写入
网络       较轻        • 数据上报带宽主要压力来源:
- 采集指标数量
- 采集频率设置
- 并发采集任务数

2. Transfer (传输层)

资源类型    典型消耗    压力点
--------------------------------
内存       1-2GB       • 数据缓冲队列
CPU        10-30%      • 数据解析和转发
网络       中等        • 上下行数据传输
磁盘IO     中等        • 数据落盘(如果配置)关键压力点:
- 大量 agent 同时上报
- 数据转发队列堆积
- 网络带宽瓶颈

3. Index (索引服务)

资源类型    典型消耗    压力点
--------------------------------
内存       4-8GB       • 索引缓存
CPU        20-40%      • 索引更新计算
磁盘IO     较高        • 索引持久化
网络       中等        • 集群同步主要压力:
- 指标元数据更新
- 索引重建
- 查询请求处理

4. TSDB (时序数据库)

资源类型    典型消耗    压力点
--------------------------------
内存       8GB+        • 数据缓存
CPU        30-50%      • 数据压缩/查询
磁盘IO     很高        • 数据写入/查询
磁盘空间   取决于保留策略  • 历史数据存储关键压力:
- 写入吞吐量
- 查询并发
- 数据压缩和清理

5. 告警模块

资源类型    典型消耗    压力点
--------------------------------
内存       2-4GB       • 规则计算
CPU        10-30%      • 告警判断
网络       较轻        • 告警通知
磁盘IO     中等        • 历史记录压力来源:
- 告警规则数量
- 告警计算频率
- 通知发送量

对比Prometheus

特性              Categraf                    Node Exporter + Prometheus
----------------------------------------------------------------
部署复杂度        低(单个agent)               高(需要多个组件)
资源占用          较低                        中等到较高
配置管理          统一、简单                  分散、相对复杂
监控能力          一体化                      需要多个exporter配合
社区支持          夜莺社区                    大型开源社区
扩展性            内置插件机制                独立exporter开发
数据存储          推送到夜莺                  Prometheus自带存储
适用场景          中小规模部署                大规模分布式监控

http://www.ppmy.cn/devtools/145368.html

相关文章

各种网站(学习资源及其他)

欢迎围观笔者的个人博客~ 也欢迎通过RSS网址https://kangaroogao.github.io/atom.xml进行订阅~ 大学指南 上海交通大学生存手册中国科学技术大学人工智能与数据科学学院本科进阶指南USTC不完全入学指南大学生活质量指北科研论 信息搜集 AI信息搜集USTC飞跃网站计算机保研 技…

Scala学习记录 如何打印输出

在Scala中,打印输出可以通过多种方式实现,以下是一些常见的打印输出方法: 1.使用printf()方法: 这是一种传统的C语言风格的打印方式,通过格式化字符串来控制输出的格式。例如,printf("整数&#xff1a…

kubeadm搭建k8s集群

前置环境: 准备三台虚拟机 192.168.1.104(用来做k8s的mater节点) 192.168.1.105(节点node2) 192.168.1.109(节点node3) 关闭防火墙 systemctl stop firewalld systemctl disable firewalld安装…

《向量数据库指南》——Milvus Cloud 2.5:Sparse-BM25引领全文检索新时代

Milvus Cloud BM25:重塑全文检索的未来 在最新的Milvus Cloud 2.5版本中,我们自豪地引入了“全新”的全文检索能力,这一创新不仅巩固了Milvus Cloud在向量数据库领域的领先地位,更为用户提供了前所未有的灵活性和效率。作为大禹智库的向量数据库高级研究员,以及《向量数据…

Jmeter 分布式压测部署--常见坑以及解决方案

JMeter 是性能测试的利器,而分布式压测更是应对高并发场景的必备技能。然而,在实际部署中,初学者常遇到种种问题,导致压测效果不理想甚至失败。你是否也曾因配置错误而耗费时间?别急,这篇文章为你全面解析 …

施耐德变频器ATV320系列技术优势:创新与安全并重

在工业自动化领域,追求高效、安全与智能已成为不可阻挡的趋势。施耐德变频器ATV320系列凭借其强大的设计标准和全球认证,成为能够帮助企业降低安装成本,提高设备性能的创新解决方案。 【全球认证,品质保障】ATV320 系列秉持施耐德…

海信中央空调 冬日取暖的舒适密码

岁末年初,喜气洋洋的春节氛围临近了,但冷冻模式同步全面开启,北方的朋友回家有暖气,但是要面临着集中供暖带来的空气干燥难耐问题,南方朋友更不用说了,回家第一件事空调一开,电热毯一插&#xf…

shiro权限校验demo

这里通过链式hashmap添加进去接口权限,用安全管理器设置过滤,并且设置登录跳转(登录页面需要自己写,shiro不提供,不像springboot那样智能) 效果如下: 点击add和update均跳转到如下登录页面 那么…