性能测试系统常用监控- -CPU
文章目录
- 性能测试系统常用监控- -CPU
- 前言
- 一、常用概念
- 二、性能指标
- 三、性能分析
- 四、调优方法
- 五、常用分析
- 5.1 top命令解析
- 5.2分析思路
前言
在性能测试过程中CPU负载状态是重要监控指标项,它综合反应了系统的负载情况,根据监控的各指标项可以对系统或应用进一步分析调优。
一、常用概念
- 架构:x86(intel、AMD、海光等)、MIPS(龙芯)、ARM(飞腾、麒麟)、SW(申威),同等架构和工艺情况下,核心数越多,扩展性越好;主频越高,性能越好
说明:一般情况下x86性能 > ARM性能 > MIPS性能,核心数越多,支撑的并发连接越多,吞吐量越大
- NUMA
NUMA(Non-Uniform Memory Access)非一致性内存访问
基本特征:
1、具有多个CPU模块,每个CPU模块由多个CPU组成,并且具有独立的本地内存,I/O槽口等。节点(模块)之间可以通过互联模块(Crossbar Switch)进行连接和信息交换,因此每个cpu可以访问整个系统的内存。减少跨核访问、跨处理器竞争冲突。
2、访问本地资源(本地内存、I/O槽口)的速度远远高于访问远地资源(其他node的资源)的速度,但是同样存在问题就是多个node 之间的资源交互非常慢,当cpu增多的情况下,性能提升的幅度并不是很高,无法实现性能的现象增加。
- SMP
SMP(Symmetric Multi-processing)对称多处理器
基本特征:
1、 服务器中多个cpu对策工作,无主次,各cpu共享相同的物理内存,每个cpu访问内存任何地址所需时间相同,也被称为一致性内存访问(UMA)。
2、系统中所有资源 (CPU 、内存、 I/O 等 ) 都是共享的。也正是由于这种特征,导致了 SMP 服务器的主要问题,那就是它的扩展能力非常有限。对于 SMP 服务器而言,每一个共享的环节都可能造成 SMP 服务器扩展时的瓶颈,而最受限制的则是内存。
- 绑核
设置进程的处理器亲和性,可以将进程绑定到特定的一个或多个CPU上去执行,而不允许将进程调度到其他cpu上,减少切换(软中断)从而提高性能。
taskset -pc cpulist pid
说明:fffff:表示进程可以在host上任何cpu运行
二、性能指标
CPU使用率:用户CPU
、系统CPU
、IOWAIT、软中断
、硬中断
、窃取CPU、客户CPU
上下文切换:自愿上下文切换、非自愿上下文切换
平均负载
CPU缓存命中率
三、性能分析
工具或命令:top、ps、vmwait、mpstat、sar、piestat、strace、perf、execsnoop、htop、atop
模块 | 类型 | 度量方法 | 衡量标准 |
---|---|---|---|
CPU | 使用情况 | 1.vmstat统计1-id计数,”%util” 2.sar –u统计1-%idle计数,”%util” 3.dstat统计1-idl计数 4.mpstat –P ALL统计1-%idle计数 5.ps统计cpu计数 | 注意>=50% 告警>=70% 严重>=90% |
CPU | 满载 | 1.vmstat的r计数 >CPU逻辑颗数 2.sar –q,”runq-sz” >CPU逻辑颗数 3.dstat –p,”run” >CPU逻辑颗数 | 运行队列大于1时,证明已经有一定负载,不过计数也不绝对,需进一步分析其他资源情况来判断CPU是否已经满载 |
CPU | 错误 | 通过perf工具捕获处理器错误信息 |
四、调优方法
CPU绑定、进程CPU资源限制、中断负载均衡、CPU缓存、NUMA优化
五、常用分析
5.1 top命令解析
Load average:24.23, 8.27, 3.57 #过去1、5、15分钟系统负载,分析负载趋势:是否增加,稳固,降低等。
cpu使用率=100% - %id
指标项 | 描述 |
---|---|
%cpu | cpu使用率,实际数值可以超过100%,最大值为100N,N为CPU核心个数 |
us | 用户态cpu占用率 |
sy | 系统内核态cpu占用率 |
id | cpu空闲率 |
wa | cpu等待输入输出占比 |
hi | 硬中断占比 |
si | 软中断占比 |
Mem total | 物理内存总量 |
Mem used | 使用的物理内存总量 |
Mem free | 空闲内存总量 |
Mem buff/cache | 用作内核缓存的内存量/缓冲区总量 |
Swap total | 使用的交换区总量 |
Swap used | 空闲交换区总量 |
tips
top命令后按d,修改打印间隔,W保存设置,下次进入也生效
top命令后按f,进入列配置,d选中添加或移除,W保存设置,下次进入也生效
top命令后按1,查看各颗cpu利用详情
重定向输出:top –b –d 1 –n 3 > top.log #-b:对齐输出,-d:延迟间隔,-n:迭代次数。(只显示前10行: top -b -d 1 -n 3 |grep ^top -A 10)
说明:大量网络吞吐量会导致占用CPU的资源增大,大量的CPU开销会尝试更多的内存使用
-
虚拟内存
当系统的物理内存不够用时,需要将物理内存中一部分空间释放出来,以供当前运行程序使用。被释放的空间可能来自于很长时间没有操作的程序,被释放用的程序被临时保存到虚拟内存空间中,等程序需要运行时,再从虚拟内存中恢复保存的数据到物理内存中。系统总是在物理内存不够时,才进行内存之间的交换。 -
软中断
软中断优先级低于硬中断,软中断消耗的cpu周期相对比硬中断要多。负责将包进行各种处理,完成从驱动层、到网络协议栈,最终把处理出来的数据放到socker的接收buffer中。
5.2分析思路
- %usr:用户态消耗时间,如果比较大;说明用户程序本身有CPU瓶颈,需要优化程序本身。
- %sys:系统内核消耗时间,如果比较大;说明系统调用函数花费时间很多,系统调用有CPU瓶颈,可能是程序非常多次调用系统内核函数导致,需要优化代码。
- %idle:空闲cpu,如果较大,则CPU不是瓶颈。