利用pprof对golang进行性能分析

news/2025/3/17 11:56:07/

利用pprof进行性能分析

pprof性能分析的5个方面

一、性能分析的五个核心维度

  • CPU分析 - 剖析程序的CPU使用情况,定位高耗时函数

  • 内存分析 - 追踪内存分配与泄露,优化内存使用模式

  • IO分析 - 监控文件/网络IO操作,发现瓶颈资源

  • Goroutine分析 - 检测协程泄露与异常堆栈

  • 并发问题分析 - 诊断死锁及通过race detector检测数据竞争

数据采集时间

生产环境采集:选择业务低峰期进行采样(凌晨2-4点)

测试环境采集:模拟真实负载场景进行压力测试

黄金准则:采样时长控制在30-60秒,确保覆盖完整业务周期

pprof集成方案

1、方案1:HTTP服务集成(推荐)

import ("net/http",_ "net/http/pprof"
)func main(){go func(){if err:=http.ListenAndServer(addr:"6060",handler:nil);err!=nil{log.Fatal(err)}os.Exit(code:0)}()
}

可以加入runtime,开启对锁调用的跟踪。

import ("runtime"
)func main(){runtime.SetMutexProfileFraction(rate:1) //开启对锁的跟踪runtime.SetBlockProfileRate(rate:1)  //开启对阻塞的跟踪go func(){if err:=http.ListenAndServer(addr:"6060",handler:nil);err!=nil{log.Fatal(err)}os.Exit(code:0)}()
}

有聪明的小伙伴可能会问“持续性采样,会不会影响服务器性能啊”。其实不会,pprof服务会按需采样,大部分端点只在请求时生成数据持续监控。只有runtime统计信息(如goroutine数量)会实时更新,因此只要控制好你的请求频率,不会对生成开发过程造成很大影响。

2、通过基准测试采集数据

func BenchmarkMyFunc(b *testing.B) {// 测试逻辑...
}

执行命令采集数据go test -bench=. -cpuprofile=cpu.out

诊断端点详解

针对第一种HTTP服务集成,访问 http://localhost:6060/debug/pprof/ 获取以下分析入口:

分析类型描述启用方式
allocs跟踪所有内存分配情况(包括已释放的内存)默认启用
block分析阻塞操作(如 channel 阻塞、锁等待)需调用 SetBlockProfileRate
cmdline显示程序启动时的命令行参数默认启用
goroutine统计当前所有 goroutine 的堆栈跟踪信息默认启用
heap分析当前活跃的堆内存分配(与 allocs 不同,仅包含未释放的内存)默认启用
mutex跟踪锁竞争情况(如 sync.Mutex 的争用)需调用 SetMutexProfileFraction
profile采集 CPU 使用数据,支持 seconds 参数(默认 30 秒)默认启用
threadcreate跟踪操作系统线程创建情况(常用于检测 goroutine 泄漏)默认启用

我们发现,在http://localhost:6060/debug/pprof/中的文件可读性非常差,实际上它只是作为一个数据源。我们可以通过性能分析工具对其文件进行分析。golang中有自带的go tool pprof工具。

可以直接将文件下载下来对文件进行分析,也可以直接使用文件的url。

如果要导出图片或者pdf等文件,需要下载 graphviz。大家想的话,可以自己搜索下载。

可视化分析

可以使用 go tool pprof +source (source可以是可执行文件,也可以是网址。)

例如 go tool pprof http://localhost:6060/debug/pprof/allocs
可以在命令行中分析程序内存使用情况。

go tool pprof http://localhost:6060/debug/pprof/profile?seconds=30
可以分析CPU使用情况。(采集30秒)

运行过上述命令后,即进入命令行终端。可以通过help查看支持的指令。

我们介绍几个常用的:top,list,web

top命令 显示资源消耗TOP N函数

最常用的top,查看使用的数据,默认取前10条,可以使用top 5 ,可以查看消耗资源(内存,协程数,cpu用的最多的等等)最多的5个。其中的指标有:

指标全称技术定义
flatExclusive Time函数自身直接消耗的CPU时间/内存量(不包含子调用)
flat%Exclusive Percentage当前函数独占资源占总采样资源的百分比
cumCumulative Time函数及其调用链消耗的总资源(包含所有子调用)
cum%Cumulative Percentage函数调用链资源消耗占总采样资源的百分比
sum%Aggregated Percentage当前函数及其之前函数资源消耗的累计占比(TOP列表特有指标)

list命令 源码级函数分析

通过list可以展开源代码,list + 某个interface,或者函数,会列出其所有interface对应的方法,或所有函数实现的源代码。可以结合top一起使用,查看消耗资源最多的出现在

web生成可视化图形

通过 web可以打开分析的连线图。

图中,有很多长方形,框框越大,代表消耗的资源越多。线约粗,整个调用栈消耗的资源越多。

每个方格中第一行,代表包名。
第二行,对象名。
第三行代表方法名。
第四行,flat(flat%)。
第五行,cum(cum%)。

图形化分析

通过 go tool pprof 的 Web 交互模式,可以将远程 pprof 数据本地可视化,实现命令行功能的图形化操作。具体流程如下:

go tool pprof -http=:8000 http://localhost:6060/debug/pprof/goroutine

功能模块对应命令行操作核心作用交互优势
Toptop展示资源消耗 Top N 的函数(按 CPU/内存/锁等指标排序)动态排序 + 百分比占比可视化
Graphweb生成函数调用关系拓扑图(需 Graphviz)链路依赖关系一目了然
Flame Graph无直接对应命令通过火焰图直观定位性能瓶颈(层级宽度=资源消耗量)快速识别热点代码路径
Peekpeek <function>聚焦特定函数及其上下游调用链无需记忆命令,点击交互
Sourcelist <function>源码级资源消耗分析(显示每行代码的资源开销)直接关联业务代码
Comparediff_base对比两个 Profile 文件的差异(常用于优化前后效果验证)差异高亮 + 变化量统计

关键特性说明:

  1. 本地化分析

    工具可以将远程 pprof 数据下载到本地(存储于 ~/pprof 目录)进行分析,避免对生产服务造成性能影响。

  2. ​协议兼容性

    支持 HTTP/HTTPS 协议拉取数据,适用于 Kubernetes 等容器环境。
    例如 go tool pprof -http=:8000 https://k8s-cluster:443/debug/pprof/profile

  3. ​原生指令支持

    网页顶部提供命令行输入框,可直接执行 top -cum 等高级参数指令,实现精准过滤。


http://www.ppmy.cn/news/1579800.html

相关文章

程序地址空间:深度解析其结构,原理与在计算机系统中的应用价值

目录 1. 程序地址空间回顾 1.1 虚拟地址 2.进程地址空间 分页&虚拟地址空间 引入新概念 解释上述关于同样的地址不同的变量值问题 回答一个历史遗留问题 ​编辑 3.虚拟内存管理 虚拟内存是什么 虚拟地址空间区域划分 为什么要有虚拟地址空间 1. 程序地址空间回…

C++:二分习题

1. 借教室 503. 借教室 - AcWing题库 在大学期间&#xff0c;经常需要租借教室。 大到院系举办活动&#xff0c;小到学习小组自习讨论&#xff0c;都需要向学校申请借教室。 教室的大小功能不同&#xff0c;借教室人的身份不同&#xff0c;借教室的手续也不一样。  面对海…

ICMP 协议

文章目录 ICMP 协议概述数据包格式实例分析ICMP 请求ICMP 应答 参考 本文为笔者学习以太网对网上资料归纳整理所做的笔记&#xff0c;文末均附有参考链接&#xff0c;如侵权&#xff0c;请联系删除。 ICMP 协议 概述 ICMP&#xff08;Internet Control Message Protocol&…

机器学习中的激活函数是什么起什么作用

在机器学习&#xff0c;尤其是神经网络中&#xff0c;​激活函数​&#xff08;Activation Function&#xff09;是一个非常重要的组件。它的主要作用是为神经网络引入非线性&#xff0c;从而使神经网络能够学习和表示复杂的模式或函数。 1.激活函数的定义 激活函数是一个数学…

Matlab 汽车振动多自由度非线性悬挂系统和参数研究

1、内容简介 略 Matlab 169-汽车振动多自由度非线性悬挂系统和参数研究 可以交流、咨询、答疑 2、内容说明 略 第二章 汽车模型建立 2.1 汽车悬架系统概述 2.1.1 悬架系统的结构和功能 2.1.2 悬架分类 2.2 四分之一车辆模型 对于车辆动力学&#xff0c;一般都是研究其悬…

90.HarmonyOS NEXT应用发布与版本管理指南:规范化发布流程

温馨提示&#xff1a;本篇博客的详细代码已发布到 git : https://gitcode.com/nutpi/HarmonyosNext 可以下载运行哦&#xff01; HarmonyOS NEXT应用发布与版本管理指南&#xff1a;规范化发布流程 文章目录 HarmonyOS NEXT应用发布与版本管理指南&#xff1a;规范化发布流程1.…

Linux基础开发工具—vim

目录 1、vim的概念 2、vim的常见模式 2.1 演示切换vim模式 3、vim命令模式常用操作 3.1 移动光标 3.2 删除文字 3.3 复制 3.4 替换 4、vim底行模式常用命令 4.1 查找字符 5、vim的配置文件 1、vim的概念 Vim全称是Vi IMproved&#xff0c;即说明它是Vi编辑器的增强…

ffmpeg + opencv 打静态库编译到可执行文件中

下载ffmpeg ,我下载的为6.0 版本,解压后执行: ./configure --enable-static --disable-shared --pkg-config-flags=“–static” --extra-cflags=“-fPIC” --extra-cxxflags=“-fPIC” --prefix=/usr/local2.等待配置完成,执行 make && make install 进行编译安装…