Metrics
Prometheus存在多种不同的监控指标Metrics,在不同的场景下应该要选择不同的Metrics。
1.Counter:只增不减的计数器
Counter类型的指标其工作方式和计数器一样,只增不减(除非系统发生重置)。常见的监控指标,如http_requests_total是Counter类型的监控指标。 一般在定义Counter类型指标的名称时推荐使用==_total==作为后缀。
-
通过increase函数获取过去五分钟请求数量
increase(http_requests_total[5m])
-
counter中函数
Inc() //指标加一Add(float64) //指标加任意非负数
2.Gauge:可增可减的仪表盘
与Counter不同,Gauge类型的指标侧重于反应系统的当前状态。因此这类指标的样本数据可增可减。常见指标如:node_memory_MemFree(主机当前空闲的内容大小)、node_memory_MemAvailable(可用内存大小)都是Gauge类型的监控指标。
通过Gauge指标,用户可以直接查看系统的当前状态。
-
gauge中函数
Dec() //减一 Inc() //加一 Add(float64) //指标加任意数 Set(float64) //直接设置值
3.使用Histogram分析数据分布情况
Histogram和Summary主用用于统计和分析样本的分布情况。
以系统API调用的平均响应时间为例:如果大多数API请求都维持在100ms的响应时间范围内,而个别请求的响应时间需要5s,那么就会导致某些WEB页面的响应时间落到中位数的情况,而这种现象被称为长尾问题。
为了区分是平均的慢还是长尾的慢,最简单的方式就是按照请求延迟的范围进行分组。例如,统计延迟在010ms之间的请求数有多少而1020ms之间的请求数又有多少。通过这种方式可以快速分析系统慢的原因。
-
Histogram中的函数
Observe() //上报一个指标
4.Summary
使用较少