背景
如果你要为应用程序构建规范或用户故事,那么务必先把应用程序每个组件的监控指标考虑进来,千万不要等到项目结束或部署之前再做这件事情。——《Prometheus监控实战》
去年写了一篇在Docker环境下部署若依微服务ruoyi-cloud项目的文章,当时使用的是 docker-compose
在单台机器上部署若依微服务 ruoyi-cloud
项目;在这个基础上,作为演示项目,我们计划实现对所有基础组件和微服务的监控。之前记录了搭建 Prometheus
与 Grafana
监控系统的过程。今天这篇文章主要是记录下对 Nginx
和 Nacos
服务的监测,用到的 exporter
是: nginx-prometheus-exporter
, Nacos
自带了一个用于监控的内置端点。
虚机资源
共用到了2台虚机,1台作为应用服务节点,1台运维监控节点。
主机名 | IP | 说明 |
---|---|---|
svc | 192.168.44.168 | 服务节点 |
ops | 192.168.44.169 | 监控节点 |
基本选用当前最新版本,即将安装的 Prometheus
和 Grafana
及组件版本信息如下:
- Prometheus版本:v2.54.1
- Grafana版本:11.2.0
- nginx-prometheus-exporter版本:v1.3.0
系统环境
[root@ops ~]# uname -a
Linux ops 5.10.0-182.0.0.95.oe2203sp3.x86_64 #1 SMP Sat Dec 30 13:10:36 CST 2023 x86_64 x86_64 x86_64 GNU/Linux
[root@ops ~]# cat /proc/version
Linux version 5.10.0-182.0.0.95.oe2203sp3.x86_64 (root@dc-64g.compass-ci) (gcc_old (GCC) 10.3.1, GNU ld (GNU Binutils) 2.37) #1 SMP Sat Dec 30 13:10:36 CST 2023
Grafana_30">ops节点:docker-compose安装Prometheus与Grafana
参考云原生之运维监控实践-OpenEuler22.03SP3上安装Prometheus与Grafana实现主机状态监测
prometheusexporter_34">svc节点:docker-compose安装nginx-prometheus-exporter
有了 Prometheus
与 Grafana
的基础环境,我们来实现对 Nginx
状态的监控:通过 nginx-prometheus-exporter
快速采集 Nginx
运行数据(如请求数、连接数、响应时间等)并以 Prometheus
格式提供,供 Prometheus
进行采集和分析。
NginxExporterVersion.jpg" />
Nginx_39">验证Nginx的指标端点
命令行输入:
nginx -V 2>&1 | grep -o with-http_stub_status_module
- 如果在终端中输出with-http_stub_status_module,则说明Nginx已启用stub_status模块。
- 如果未输出任何结果,则可以使用–with-http_stub_status_module参数从源码重新配置编译Nginx。
在安装 nginx-prometheus-exporter
之前,需要先在 Nginx
的配置文件中开放 stub_status
端点。
location = /stub_status { # 具体路径可根据业务情况进行调整stub_status;}
浏览器访问验证端点:http://192.168.44.168/stub_status
Active connections: 60
server accepts handled requests86247 86247 113387
Reading: 0 Writing: 5 Waiting: 55
prometheusexporter_66">安装nginx-prometheus-exporter
在需要监测的主机上,编辑 docker-compose.yml
文件,增加安装 nginx-prometheus-exporter
配置。
- [root@svc monitoring]# vi docker-compose.yml
version: '3'
services:ops-nginx-exporter:container_name: ops-nginx-exporterimage: nginx/nginx-prometheus-exporter:1.3.0networks:- custom_networkenvironment:SCRAPE_URI: http://192.168.44.168/stub_statusports:- "9113:9113"restart: unless-stopped
通过命令: docker-compose up -d
完成镜像拉取、并启动 ops-nginx-exporter
服务。
修改Prometheus配置
在 Prometheus
配置中增加对svc主机上 Nginx
运行状态的抓取配置。
- [root@ops monitoring]# vi ./prometheus/conf/prometheus.yml
scrape_configs:- job_name: 'ops-nginx'scrape_interval: 15sstatic_configs:- targets:- 192.168.44.168:9113
重启 Prometheus
容器。
[root@ops monitoring]# docker restart ops-prometheus
prometheusexporter_109">验证nginx-prometheus-exporter安装结果
- 浏览器验证metrics端点
浏览器访问http://192.168.44.168:9113/metrics
- Prometheus控制台验证nginx相关的指标
NginxIndex.jpg" />
Grafana_118">配置Grafana对主机状态的可视化
浏览器访问http://192.168.44.169:3000。
- 配置数据源
- 点击左侧菜单中的"Add new connection"。
- 选择或搜索"Data Sources"。
- 点击"Add data source"并选择"Prometheus"。
- 在"HTTP"部分输入Prometheus地址,eg:http://192.168.44.169:9090
- 点击"Save & Test"确认连接成功。
- 查看现成的仪表板
https://grafana.com/grafana/dashboards/这个页面是 Grafana
的官方仪表板目录,用户可以在这里找到和共享各种现成的 Grafana
仪表板。这些仪表板覆盖了多种监控需求,包括系统性能、应用监控、网络流量等。用户可以根据自己的需求搜索和导入适合的仪表板,提高监控效率和可视化效果。这里我们搜索 Nginx
,结果中有个 NGINX by nginxinc
,点击进去可以查看详细的UI效果,复制仪表板的id,此处是11199。
- 导入现成的仪表板
- 在右侧菜单中点击"New"按钮,然后选择"Import"。
- 在输入框中,可以直接输入现成仪表板的ID,或者上传JSON文件。常用的主机监控仪表板ID是11199(NGINX by nginxinc)。
- 点击"Load",随后选择已配置好的数据源。
- 点击"Import"完成导入。
NginxImport.jpg" />
Nginx_141">Nginx监控效果
NginxDashboard.jpg" />
Nacos_144">svc节点:Nacos服务
无需 exporter
, Nacos
提供了一个用于监控的内置端点,可以通过该端点获取 Nacos
的各种监控指标,并将其暴露给 Prometheus
进行采集和存储。 Nacos
本身是一个 SpringBoot
应用,通过内置的监控端点 /actuator/prometheus
可以获取 Nacos
的各种监控指标,包括服务注册与发现的状态、配置管理的信息、健康检查的结果等。
修改Prometheus配置
在 Prometheus
配置中增加对svc主机上 Nacos
运行状态的抓取配置。
- [root@ops monitoring]# vi ./prometheus/conf/prometheus.yml
scrape_configs:- job_name: 'ops-nacos'metrics_path: '/nacos/actuator/prometheus'scrape_interval: 15sstatic_configs:- targets:- 192.168.44.168:8848
重启 Prometheus
容器。
[root@ops monitoring]# docker restart ops-prometheus
验证nacos指标端点
- 浏览器验证metrics端点
浏览器访问http://192.168.44.168:8848/nacos/actuator/prometheus
- Prometheus控制台验证nacos相关的指标
NacosIndex.jpg" />
Grafana_178">配置Grafana对主机状态的可视化
浏览器访问http://192.168.44.169:3000。
- 配置数据源
- 点击左侧菜单中的"Add new connection"。
- 选择或搜索"Data Sources"。
- 点击"Add data source"并选择"Prometheus"。
- 在"HTTP"部分输入Prometheus地址,eg:http://192.168.44.169:9090
- 点击"Save & Test"确认连接成功。
- 查看现成的仪表板
https://grafana.com/grafana/dashboards/这个页面是 Grafana
的官方仪表板目录,用户可以在这里找到和共享各种现成的 Grafana
仪表板。这些仪表板覆盖了多种监控需求,包括系统性能、应用监控、网络流量等。用户可以根据自己的需求搜索和导入适合的仪表板,提高监控效率和可视化效果。这里我们搜索 Nacos
,结果中有个 Nacos
,点击进去可以查看详细的UI效果,复制仪表板的id,此处是13221。
- 导入现成的仪表板
- 在右侧菜单中点击"New"按钮,然后选择"Import"。
- 在输入框中,可以直接输入现成仪表板的ID,或者上传JSON文件。常用的主机监控仪表板ID是13221(Nacos)。
- 点击"Load",随后选择已配置好的数据源。
- 点击"Import"完成导入。
NacosImport.jpg" />
Nacos_201">Nacos监控效果
NacosDashboard.jpg" />
小总结
If you can’t measure it, you can’t improve it!
没有度量就没有改进,实际上,监控系统有以下两个客户:技术,业务。上述内容即是对技术组件的监控,方便技术方面的改进与优化。
本文记录了在 Docker
环境下通过 Prometheus
和 Grafana
实现对 Nginx
和 Nacos
服务的监控。具体步骤包括在服务节点上使用 docker-compose
安装 nginx-prometheus-exporter
,配置 Prometheus
抓取 Nginx
和 Nacos
的监控数据,并在 Grafana
中配置数据源和导入现成的监控仪表板,以实现对反向代理服务和注册中心服务的性能监控和可视化。
Reference
- https://github.com/nginxinc/nginx-prometheus-exporter/releases
- https://grafana.com/grafana/dashboards/
If you have any questions or any bugs are found, please feel free to contact me.
Your comments and suggestions are welcome!