简单prometheus+grafana+pushgateway采集GPU利用率和交换机流量

embedded/2025/1/20 19:09:26/

prometheuspushgateway_0">1、prometheus+pushgateway

从https://prometheus.io/download/下载prometheus和pushgateway
下载后修改prometheus.yaml
pushgateway需要设置honor_labels: true才能保留原来的job、instance等
在这里插入图片描述
然后启动:./prometheus --config.file=“./prometheus.yml”
./pushgateway
访问pushgateway:http://x.x.x.x:9091
查看pushgateway数据:http://x.x.x.x:9091/metrics
注意:pushgateway只保留最后一次推送的值,prometheus拉取的时候也是拉取pushgateway当前存储的值

查看prometheus:http://x.x.x.x:9090
在这里插入图片描述
Status->Targets里面可以检查目标状态、上次拉取时间等

注意:http://x.x.x.x:9090/metrics并不能查看到所有表项

grafana_17">2、grafana

grafana安装:
apt-get install -y software-properties-common
wget -q -O - https://packages.grafana.com/gpg.key | sudo apt-key add -
add-apt-repository “deb https://packages.grafana.com/oss/deb stable main”
apt install grafana
systemctl start grafana-server
systemctl enable grafana-server
登录:http://x.x.x.x:3000
用户名密码admin admin

有的exporter源码会提供grafana配置文件,比如dcgm-exporter中:
dcgm-exporter\grafana\dcgm-exporter-dashboard.json

在Home->Dashboards->New->Import中导入json就可以看到图形

修改Y轴的单位

对应panel右上角三个点中选择Edit,Standard options,Uint中选择(忘了。。待确认)

安装dcgm-exporter

https://github.com/NVIDIA/dcgm-exporter
下载源码,然后:
kubectl create namespace gpu-monitoring
kubectl apply dcgm-exporter/service-monitor.yaml
kubectl apply dcgm-exporter/dcgm-exporter.yaml -n gpu-monitoring
创建nodeport并提交

apiVersion: v1
kind: Service
metadata:name: dcgm-exporternamespace: gpu-monitoring
spec:selector:app.kubernetes.io/name: dcgm-exporterports:- port: 9400targetPort: 9400nodePort: 30094type: NodePort

测试:curl http://localhost:30094/metrics

问题1:

error: resource mapping not found for name: "dcgm-exporter" namespace: "" from "service-monitor.yaml": no matches for kind "ServiceMonitor" in version "monitoring.coreos.com/v1"
ensure CRDs are installed first

下载https://github.com/prometheus-operator/prometheus-operato,提交prometheus-operator\prometheus-operator\example\prometheus-operator-crd\monitoring.coreos.com_servicemonitors.yaml


http://www.ppmy.cn/embedded/155556.html

相关文章

STM32 FreeROTS Tickless低功耗模式

低功耗模式简介 FreeRTOS 的 Tickless 模式是一种特殊的运行模式,用于最小化系统的时钟中断频率,以降低功耗。在 Tickless 模式下,系统只在有需要时才会启动时钟中断,而在无任务要运行时则完全进入休眠状态,从而降低功…

开源许可证(Open Source Licenses)

开源许可证(Open Source Licenses)是一种允许用户查看、修改、共享和分发代码的法律协议。它们规定了代码在不同场景下的使用权限和责任。开源许可证的种类很多,不同的许可证在使用条件上有所不同。下面是一些常见的开源许可证及其特点&#…

SpringCloud -根据服务名获取服务运行实例并进行负载均衡

Nacos注册中心 每个服务启动之后都要向注册中心发送服务注册请求&#xff0c;注册中心可以和各个注册客户端自定义协议实现服务注册和发现。 pom.xml <dependency><groupId>com.alibaba.cloud</groupId><artifactId>spring-cloud-starter-alibaba-na…

【Vim Masterclass 笔记19】S08L36 + L37:第八章 Vim 可视化模式同步练习(含点评课内容)

文章目录 S08L36 Exercise 10 - Visual Mode1 训练目标2 操作指令2.1. 打开 visual-practice.txt 文件2.2. 字符级可视化模式练习 Characterwise Visual Mode2.3. 文本行可视化模式练习 Linewise Visual Mode2.4. 区块级可视化模式练习 Blockwise Visual Mode 3 退出 Vim S08L3…

Micrometer+Zipkin 分布式链路追踪

MicrometerZipkin 分布式链路追踪&#xff08;Distributed Tracing&#xff09;是一种用于监控和分析分布式系统性能的技术。它允许开发人员和运维人员追踪请求在分布式系统中的传播路径&#xff0c;包括跨服务调用、数据库访问、缓存查询等操作。通过分布式链路追踪&#xff0…

Ubuntu 24.04 LTS 空闲硬盘挂载到 文件管理器的 other locations

Ubuntu 24.04 LTS 确认硬盘是否被识别 使用 lsblk 查看信息&#xff0c;其中sda这个盘是我找不到的&#xff0c;途中是挂在好的。 分区和格式化硬盘 如果新硬盘没有分区&#xff0c;你需要先分区并格式化它。假设新硬盘为 /dev/sdb&#xff0c;使用 fdisk 或 parted 对硬盘…

Spring Boot——日志介绍和配置

1. 日志的介绍 在前面的学习中&#xff0c;控制台上打印出来的一大堆内容就是日志&#xff0c;可以帮助我们发现问题&#xff0c;分析问题&#xff0c;定位问题&#xff0c;除此之外&#xff0c;日志还可以进行系统的监控&#xff0c;数据采集等 2. 日志的使用 在程序中获取日…

动态主机配置协议 (DHCPv4)介绍,详细DHCP协议学习笔记

定义 动态主机配置协议 (DHCP) 是一种用于集中对用户 IPv4 地址进行动态管理和配置的技术。为与 IPv6 动态主机配置协议 (DHCPv6) 进行区分&#xff0c;本文统一将动态主机配置协议称为 DHCPv4。 DHCPv4 协议由 RFC 2131 定义&#xff0c;采用客户端/服务器通信模式&#xff…