云原生之运维监控实践-使用Prometheus与Grafana实现对Nginx和Nacos服务的监测

devtools/2024/11/20 16:32:56/

背景

如果你要为应用程序构建规范或用户故事,那么务必先把应用程序每个组件的监控指标考虑进来,千万不要等到项目结束或部署之前再做这件事情。——《Prometheus监控实战》

去年写了一篇在Docker环境下部署若依微服务ruoyi-cloud项目的文章,当时使用的是 docker-compose 在单台机器上部署若依微服务 ruoyi-cloud 项目;在这个基础上,作为演示项目,我们计划实现对所有基础组件和微服务的监控。之前记录了搭建 PrometheusGrafana 监控系统的过程。今天这篇文章主要是记录下对 NginxNacos 服务的监测,用到的 exporter 是: nginx-prometheus-exporterNacos 自带了一个用于监控的内置端点。

虚机资源

共用到了2台虚机,1台作为应用服务节点,1台运维监控节点。

主机名IP说明
svc192.168.44.168服务节点
ops192.168.44.169监控节点

基本选用当前最新版本,即将安装的 PrometheusGrafana 及组件版本信息如下:

  • Prometheus版本:v2.54.1
  • Grafana版本:11.2.0
  • nginx-prometheus-exporter版本:v1.3.0

系统环境

[root@ops ~]# uname -a
Linux ops 5.10.0-182.0.0.95.oe2203sp3.x86_64 #1 SMP Sat Dec 30 13:10:36 CST 2023 x86_64 x86_64 x86_64 GNU/Linux
[root@ops ~]# cat /proc/version
Linux version 5.10.0-182.0.0.95.oe2203sp3.x86_64 (root@dc-64g.compass-ci) (gcc_old (GCC) 10.3.1, GNU ld (GNU Binutils) 2.37) #1 SMP Sat Dec 30 13:10:36 CST 2023

Grafana_30">ops节点:docker-compose安装Prometheus与Grafana

参考云原生运维监控实践-OpenEuler22.03SP3上安装Prometheus与Grafana实现主机状态监测

prometheusexporter_34">svc节点:docker-compose安装nginx-prometheus-exporter

有了 PrometheusGrafana 的基础环境,我们来实现对 Nginx 状态的监控:通过 nginx-prometheus-exporter 快速采集 Nginx 运行数据(如请求数、连接数、响应时间等)并以 Prometheus 格式提供,供 Prometheus 进行采集和分析。

2024-11-16-1-<a class=NginxExporterVersion.jpg" />

Nginx_39">验证Nginx的指标端点

命令行输入:

nginx -V 2>&1 | grep -o with-http_stub_status_module
  • 如果在终端中输出with-http_stub_status_module,则说明Nginx已启用stub_status模块。
  • 如果未输出任何结果,则可以使用–with-http_stub_status_module参数从源码重新配置编译Nginx

在安装 nginx-prometheus-exporter 之前,需要先在 Nginx 的配置文件中开放 stub_status 端点。

    location = /stub_status { # 具体路径可根据业务情况进行调整stub_status;}

浏览器访问验证端点:http://192.168.44.168/stub_status

Active connections: 60 
server accepts handled requests86247 86247 113387 
Reading: 0 Writing: 5 Waiting: 55 

prometheusexporter_66">安装nginx-prometheus-exporter

在需要监测的主机上,编辑 docker-compose.yml 文件,增加安装 nginx-prometheus-exporter 配置。

  • [root@svc monitoring]# vi docker-compose.yml
version: '3'
services:ops-nginx-exporter:container_name: ops-nginx-exporterimage: nginx/nginx-prometheus-exporter:1.3.0networks:- custom_networkenvironment:SCRAPE_URI: http://192.168.44.168/stub_statusports:- "9113:9113"restart: unless-stopped

通过命令: docker-compose up -d 完成镜像拉取、并启动 ops-nginx-exporter 服务。

修改Prometheus配置

Prometheus 配置中增加对svc主机上 Nginx 运行状态的抓取配置。

scrape_configs:- job_name: 'ops-nginx'scrape_interval: 15sstatic_configs:- targets:- 192.168.44.168:9113   

重启 Prometheus 容器。

[root@ops monitoring]# docker restart ops-prometheus

prometheusexporter_109">验证nginx-prometheus-exporter安装结果

  • 浏览器验证metrics端点

浏览器访问http://192.168.44.168:9113/metrics

  • Prometheus控制台验证nginx相关的指标

2024-11-16-2-<a class=NginxIndex.jpg" />

Grafana_118">配置Grafana对主机状态的可视化

浏览器访问http://192.168.44.169:3000。

  • 配置数据源
  1. 点击左侧菜单中的"Add new connection"。
  2. 选择或搜索"Data Sources"。
  3. 点击"Add data source"并选择"Prometheus"。
  4. 在"HTTP"部分输入Prometheus地址,eg:http://192.168.44.169:9090
  5. 点击"Save & Test"确认连接成功。
  • 查看现成的仪表板

https://grafana.com/grafana/dashboards/这个页面是 Grafana 的官方仪表板目录,用户可以在这里找到和共享各种现成的 Grafana 仪表板。这些仪表板覆盖了多种监控需求,包括系统性能、应用监控、网络流量等。用户可以根据自己的需求搜索和导入适合的仪表板,提高监控效率和可视化效果。这里我们搜索 Nginx ,结果中有个 NGINX by nginxinc ,点击进去可以查看详细的UI效果,复制仪表板的id,此处是11199。

  • 导入现成的仪表板
  1. 在右侧菜单中点击"New"按钮,然后选择"Import"。
  2. 在输入框中,可以直接输入现成仪表板的ID,或者上传JSON文件。常用的主机监控仪表板ID是11199(NGINX by nginxinc)。
  3. 点击"Load",随后选择已配置好的数据源。
  4. 点击"Import"完成导入。

2024-11-16-3-<a class=NginxImport.jpg" />

Nginx_141">Nginx监控效果

2024-11-16-4-<a class=NginxDashboard.jpg" />

Nacos_144">svc节点:Nacos服务

无需 exporterNacos 提供了一个用于监控的内置端点,可以通过该端点获取 Nacos 的各种监控指标,并将其暴露给 Prometheus 进行采集和存储。 Nacos 本身是一个 SpringBoot 应用,通过内置的监控端点 /actuator/prometheus 可以获取 Nacos 的各种监控指标,包括服务注册与发现的状态、配置管理的信息、健康检查的结果等。

修改Prometheus配置

Prometheus 配置中增加对svc主机上 Nacos 运行状态的抓取配置。

scrape_configs:- job_name: 'ops-nacos'metrics_path: '/nacos/actuator/prometheus'scrape_interval: 15sstatic_configs:- targets:- 192.168.44.168:8848

重启 Prometheus 容器。

[root@ops monitoring]# docker restart ops-prometheus

验证nacos指标端点

  • 浏览器验证metrics端点

浏览器访问http://192.168.44.168:8848/nacos/actuator/prometheus

  • Prometheus控制台验证nacos相关的指标

2024-11-16-5-<a class=NacosIndex.jpg" />

Grafana_178">配置Grafana对主机状态的可视化

浏览器访问http://192.168.44.169:3000。

  • 配置数据源
  1. 点击左侧菜单中的"Add new connection"。
  2. 选择或搜索"Data Sources"。
  3. 点击"Add data source"并选择"Prometheus"。
  4. 在"HTTP"部分输入Prometheus地址,eg:http://192.168.44.169:9090
  5. 点击"Save & Test"确认连接成功。
  • 查看现成的仪表板

https://grafana.com/grafana/dashboards/这个页面是 Grafana 的官方仪表板目录,用户可以在这里找到和共享各种现成的 Grafana 仪表板。这些仪表板覆盖了多种监控需求,包括系统性能、应用监控、网络流量等。用户可以根据自己的需求搜索和导入适合的仪表板,提高监控效率和可视化效果。这里我们搜索 Nacos ,结果中有个 Nacos ,点击进去可以查看详细的UI效果,复制仪表板的id,此处是13221。

  • 导入现成的仪表板
  1. 在右侧菜单中点击"New"按钮,然后选择"Import"。
  2. 在输入框中,可以直接输入现成仪表板的ID,或者上传JSON文件。常用的主机监控仪表板ID是13221(Nacos)。
  3. 点击"Load",随后选择已配置好的数据源。
  4. 点击"Import"完成导入。

2024-11-16-6-<a class=NacosImport.jpg" />

Nacos_201">Nacos监控效果

2024-11-16-7-<a class=NacosDashboard.jpg" />

小总结

If you can’t measure it, you can’t improve it!

没有度量就没有改进,实际上,监控系统有以下两个客户:技术,业务。上述内容即是对技术组件的监控,方便技术方面的改进与优化。
本文记录了在 Docker 环境下通过 PrometheusGrafana 实现对 NginxNacos 服务的监控。具体步骤包括在服务节点上使用 docker-compose 安装 nginx-prometheus-exporter ,配置 Prometheus 抓取 NginxNacos 的监控数据,并在 Grafana 中配置数据源和导入现成的监控仪表板,以实现对反向代理服务和注册中心服务的性能监控和可视化。

Reference

  • https://github.com/nginxinc/nginx-prometheus-exporter/releases
  • https://grafana.com/grafana/dashboards/

If you have any questions or any bugs are found, please feel free to contact me.

Your comments and suggestions are welcome!


http://www.ppmy.cn/devtools/135524.html

相关文章

乐鑫芯片模组物联网方案,实现设备快速响应控制,启明云端乐鑫代理商

在科技日新月异的今天&#xff0c;从简单的门窗传感器到复杂的家庭自动化网络&#xff0c;这些智能设备不仅提升了家庭的安全性&#xff0c;还为居住者带来了前所未有的便利。 随着物联网技术的飞速发展&#xff0c;设备通过无线通信模组实现互联互通&#xff0c;与用户的智能…

AntFlow 0.11.0版发布,增加springboot starter模块,一款设计上借鉴钉钉工作流的免费企业级审批流平台

AntFlow 0.11.0版发布,增加springboot starter模块,一款设计上借鉴钉钉工作流的免费企业级审批流平台 传统老牌工作流引擎比如activiti,flowable或者camunda等虽然功能强大&#xff0c;也被企业广泛采用&#xff0c;然后也存着在诸如学习曲线陡峭&#xff0c;上手难度大&#x…

阿里云SSL证书每三个月过期续期方法 —— 使用httpsok工具轻松自动续期

阿里云作为全球领先的云计算服务提供商&#xff0c;提供了SSL证书服务&#xff0c;可以为网站启用HTTPS加密&#xff0c;确保数据传输的安全。然而&#xff0c;许多人在使用阿里云SSL证书时可能会遇到一个问题&#xff1a;阿里云免费SSL证书每三个月就会过期&#xff0c;需要及…

鸿蒙module开发实践

模块化开发简介 鸿蒙是支持模块化开发的&#xff0c;使用模块开发可以有以下好处&#xff1a; 应用功能多样化&#xff1a;一个应用通常包含多种功能。模块化管理&#xff1a;将不同功能按模块划分和管理&#xff0c;是一种好的设计方法。独立开发&#xff1a;每个功能模块可…

Oracle 19c修改pga报ORA-00093、ORA-01078错进行分析处理

在同事修改Oracle数据库的pga时&#xff0c;出现了如下错误&#xff1a; 计划修改值&#xff1a; alter system set pga_aggregate_limit40G scopespfile sid*; alter system set pga_aggregate_target20G scopespfile sid*; SQL> shu immediate Database closed. Databa…

4. Spring Cloud Ribbon 实现“负载均衡”的详细配置说明

4. Spring Cloud Ribbon 实现“负载均衡”的详细配置说明 文章目录 4. Spring Cloud Ribbon 实现“负载均衡”的详细配置说明前言1. Ribbon 介绍1.1 LB(Load Balance 负载均衡) 2. Ribbon 原理2.2 Ribbon 机制 3. Spring Cloud Ribbon 实现负载均衡算法-应用实例4. 总结&#x…

3. langgraph中的react agent使用 (在react agent添加系统提示)

环境准备 确保你已经安装了以下库&#xff1a; langchainlangchain_openailanggraph 你可以使用以下命令进行安装&#xff1a; pip install langchain langchain_openai langgraph代码实现 1. 初始化模型 首先&#xff0c;我们需要初始化智谱AI的聊天模型。 from langch…

24-原生 JavaScript 操作 DOM:从创建元素到事件处理

笔记分享 在现代 Web 开发中&#xff0c;我们通常会使用各种框架和库&#xff08;如 React、Vue.js&#xff09;来简化 DOM 操作&#xff0c;但在某些情况下&#xff0c;理解和使用原生 JavaScript&#xff08;也称为 Vanilla JS&#xff09;操作 DOM 仍然是非常重要的技能。这…