云原生之运维监控实践-使用Prometheus与Grafana实现对Nginx和Nacos服务的监测

背景

如果你要为应用程序构建规范或用户故事，那么务必先把应用程序每个组件的监控指标考虑进来，千万不要等到项目结束或部署之前再做这件事情。——《Prometheus监控实战》

去年写了一篇在Docker环境下部署若依微服务ruoyi-cloud项目的文章，当时使用的是 docker-compose 在单台机器上部署若依微服务 ruoyi-cloud 项目；在这个基础上，作为演示项目，我们计划实现对所有基础组件和微服务的监控。之前记录了搭建 Prometheus 与 Grafana 监控系统的过程。今天这篇文章主要是记录下对 Nginx 和 Nacos 服务的监测，用到的 exporter 是： nginx-prometheus-exporter ， Nacos 自带了一个用于监控的内置端点。

虚机资源

共用到了2台虚机，1台作为应用服务节点，1台运维监控节点。

主机名	IP	说明
svc	192.168.44.168	服务节点
ops	192.168.44.169	监控节点

基本选用当前最新版本，即将安装的 Prometheus 和 Grafana 及组件版本信息如下：

Prometheus版本：v2.54.1
Grafana版本：11.2.0
nginx-prometheus-exporter版本：v1.3.0

系统环境

[root@ops ~]# uname -a
Linux ops 5.10.0-182.0.0.95.oe2203sp3.x86_64 #1 SMP Sat Dec 30 13:10:36 CST 2023 x86_64 x86_64 x86_64 GNU/Linux
[root@ops ~]# cat /proc/version
Linux version 5.10.0-182.0.0.95.oe2203sp3.x86_64 (root@dc-64g.compass-ci) (gcc_old (GCC) 10.3.1, GNU ld (GNU Binutils) 2.37) #1 SMP Sat Dec 30 13:10:36 CST 2023

Grafana_30">ops节点：docker-compose安装Prometheus与Grafana

参考云原生之运维监控实践-OpenEuler22.03SP3上安装Prometheus与Grafana实现主机状态监测

prometheusexporter_34">svc节点：docker-compose安装nginx-prometheus-exporter

有了 Prometheus 与 Grafana 的基础环境，我们来实现对 Nginx 状态的监控：通过 nginx-prometheus-exporter 快速采集 Nginx 运行数据（如请求数、连接数、响应时间等）并以 Prometheus 格式提供，供 Prometheus 进行采集和分析。

2024-11-16-1-<a class= NginxExporterVersion.jpg" />

Nginx_39">验证Nginx的指标端点

命令行输入：

nginx -V 2>&1 | grep -o with-http_stub_status_module

如果在终端中输出with-http_stub_status_module，则说明Nginx已启用stub_status模块。
如果未输出任何结果，则可以使用–with-http_stub_status_module参数从源码重新配置编译Nginx。

在安装 nginx-prometheus-exporter 之前，需要先在 Nginx 的配置文件中开放 stub_status 端点。

    location = /stub_status { # 具体路径可根据业务情况进行调整stub_status;}

浏览器访问验证端点：http://192.168.44.168/stub_status

Active connections: 60 
server accepts handled requests86247 86247 113387 
Reading: 0 Writing: 5 Waiting: 55

prometheusexporter_66">安装nginx-prometheus-exporter

在需要监测的主机上，编辑 docker-compose.yml 文件，增加安装 nginx-prometheus-exporter 配置。

[root@svc monitoring]# vi docker-compose.yml

version: '3'
services:ops-nginx-exporter:container_name: ops-nginx-exporterimage: nginx/nginx-prometheus-exporter:1.3.0networks:- custom_networkenvironment:SCRAPE_URI: http://192.168.44.168/stub_statusports:- "9113:9113"restart: unless-stopped

通过命令： docker-compose up -d 完成镜像拉取、并启动 ops-nginx-exporter 服务。

修改Prometheus配置

在 Prometheus 配置中增加对svc主机上 Nginx 运行状态的抓取配置。

[root@ops monitoring]# vi ./prometheus/conf/prometheus.yml

scrape_configs:- job_name: 'ops-nginx'scrape_interval: 15sstatic_configs:- targets:- 192.168.44.168:9113

重启 Prometheus 容器。

[root@ops monitoring]# docker restart ops-prometheus

prometheusexporter_109">验证nginx-prometheus-exporter安装结果

浏览器验证metrics端点

浏览器访问http://192.168.44.168:9113/metrics

Prometheus控制台验证nginx相关的指标

2024-11-16-2-<a class= NginxIndex.jpg" />

Grafana_118">配置Grafana对主机状态的可视化

浏览器访问http://192.168.44.169:3000。

配置数据源

点击左侧菜单中的"Add new connection"。
选择或搜索"Data Sources"。
点击"Add data source"并选择"Prometheus"。
在"HTTP"部分输入Prometheus地址，eg：http://192.168.44.169:9090
点击"Save & Test"确认连接成功。

查看现成的仪表板

https://grafana.com/grafana/dashboards/这个页面是 Grafana 的官方仪表板目录，用户可以在这里找到和共享各种现成的 Grafana 仪表板。这些仪表板覆盖了多种监控需求，包括系统性能、应用监控、网络流量等。用户可以根据自己的需求搜索和导入适合的仪表板，提高监控效率和可视化效果。这里我们搜索 Nginx ，结果中有个 NGINX by nginxinc ，点击进去可以查看详细的UI效果，复制仪表板的id，此处是11199。

导入现成的仪表板

在右侧菜单中点击"New"按钮，然后选择"Import"。
在输入框中，可以直接输入现成仪表板的ID，或者上传JSON文件。常用的主机监控仪表板ID是11199（NGINX by nginxinc）。
点击"Load"，随后选择已配置好的数据源。
点击"Import"完成导入。

2024-11-16-3-<a class= NginxImport.jpg" />

Nginx_141">Nginx监控效果

2024-11-16-4-<a class= NginxDashboard.jpg" />

Nacos_144">svc节点：Nacos服务

无需 exporter ， Nacos 提供了一个用于监控的内置端点，可以通过该端点获取 Nacos 的各种监控指标，并将其暴露给 Prometheus 进行采集和存储。 Nacos 本身是一个 SpringBoot 应用，通过内置的监控端点 /actuator/prometheus 可以获取 Nacos 的各种监控指标，包括服务注册与发现的状态、配置管理的信息、健康检查的结果等。

修改Prometheus配置

在 Prometheus 配置中增加对svc主机上 Nacos 运行状态的抓取配置。

[root@ops monitoring]# vi ./prometheus/conf/prometheus.yml

scrape_configs:- job_name: 'ops-nacos'metrics_path: '/nacos/actuator/prometheus'scrape_interval: 15sstatic_configs:- targets:- 192.168.44.168:8848

重启 Prometheus 容器。

[root@ops monitoring]# docker restart ops-prometheus

验证nacos指标端点

浏览器验证metrics端点

浏览器访问http://192.168.44.168:8848/nacos/actuator/prometheus

Prometheus控制台验证nacos相关的指标

2024-11-16-5-<a class= NacosIndex.jpg" />

Grafana_178">配置Grafana对主机状态的可视化

浏览器访问http://192.168.44.169:3000。

配置数据源

点击左侧菜单中的"Add new connection"。
选择或搜索"Data Sources"。
点击"Add data source"并选择"Prometheus"。
在"HTTP"部分输入Prometheus地址，eg：http://192.168.44.169:9090
点击"Save & Test"确认连接成功。

查看现成的仪表板

https://grafana.com/grafana/dashboards/这个页面是 Grafana 的官方仪表板目录，用户可以在这里找到和共享各种现成的 Grafana 仪表板。这些仪表板覆盖了多种监控需求，包括系统性能、应用监控、网络流量等。用户可以根据自己的需求搜索和导入适合的仪表板，提高监控效率和可视化效果。这里我们搜索 Nacos ，结果中有个 Nacos ，点击进去可以查看详细的UI效果，复制仪表板的id，此处是13221。

导入现成的仪表板

在右侧菜单中点击"New"按钮，然后选择"Import"。
在输入框中，可以直接输入现成仪表板的ID，或者上传JSON文件。常用的主机监控仪表板ID是13221（Nacos）。
点击"Load"，随后选择已配置好的数据源。
点击"Import"完成导入。

2024-11-16-6-<a class= NacosImport.jpg" />

Nacos_201">Nacos监控效果

2024-11-16-7-<a class= NacosDashboard.jpg" />

小总结

If you can’t measure it, you can’t improve it!

没有度量就没有改进，实际上，监控系统有以下两个客户：技术，业务。上述内容即是对技术组件的监控，方便技术方面的改进与优化。
本文记录了在 Docker 环境下通过 Prometheus 和 Grafana 实现对 Nginx 和 Nacos 服务的监控。具体步骤包括在服务节点上使用 docker-compose 安装 nginx-prometheus-exporter ，配置 Prometheus 抓取 Nginx 和 Nacos 的监控数据，并在 Grafana 中配置数据源和导入现成的监控仪表板，以实现对反向代理服务和注册中心服务的性能监控和可视化。