AOT漫谈专题(第三篇): 如何获取C#程序的CPU利用率

devtools/2024/10/15 5:13:50/

一:背景

1. 讲故事

上篇聊到了如何对AOT程序进行轻量级的APM监控,有朋友问我如何获取AOT程序的CPU利用率,本来我觉得这是一个挺简单的问题,但一研究不是这么一回事,这篇我们简单的聊一聊。

二:如何获取CPU利用率

1. 认识cpuUtilization字段

熟悉.NET底层的朋友应该知道,.NET线程池中有一个cpuUtilization字段就记录了当前机器的CPU利用率,所以接下来的思路就是如何把这个字段给挖出来,在挖这个字段之前也要知道 .NET6 为界限出现过两个线程池。

1)win32threadpool.cpp

这是 .NET6 之前一直使用的 .NET线程池,它是由 clr 的 1)win32threadpool.cpp 实现的,参考代码如下:


SVAL_IMPL(LONG,ThreadpoolMgr,cpuUtilization);
  1. PortableThreadPool.cs

为了更好的跨平台以及高层统一, .NET团队用C#对原来的线程池进行了重构,所以这个字段自然也落到了C#中,参考如下:


internal sealed class PortableThreadPool
{private int _cpuUtilization;
}
  1. WindowsThreadPool.cs

我原以为线程池已经被这两种实现平分天下,看来我还是年轻了,不知道什么时候又塞入了一种线程池实现 WindowsThreadPool.cs,无语了,它是简单的 WindowsThreadPool 的 C#封装,舍去了很多原来的方法实现,比如:


internal static class WindowsThreadPool
{public static bool SetMinThreads(int workerThreads, int completionPortThreads){return false;}public static bool SetMaxThreads(int workerThreads, int completionPortThreads){return false;}internal static void NotifyThreadUnblocked(){}internal unsafe static void RequestWorkerThread(){//todo...//提交到 windows线程池Interop.Kernel32.SubmitThreadpoolWork(s_work);}
}

而这个也是 Windows 版的AOT默认实现,因为 Windows线程池是由操作系统实现,没有源码公开,观察了reactos的开源实现,也未找到类似的cpuUtilization字段,这就比较尴尬了,常见的应对措施如下:

  1. 因为dump或者program中没有现成字段,只能在程序中使用代码获取。
  2. 修改windows上的 aot 默认线程池。

2. 如果修改AOT的默认线程池

在微软的官方文档:https://learn.microsoft.com/zh-cn/dotnet/core/runtime-config/threading 上就记录了Windows线程池的一些概况以及如何切换线程池的方法,截图如下:

这里选择 MSBuild 的方式来配置。


<Project Sdk="Microsoft.NET.Sdk"><PropertyGroup><OutputType>Exe</OutputType><TargetFramework>net8.0</TargetFramework><ImplicitUsings>enable</ImplicitUsings><Nullable>enable</Nullable><PublishAot>true</PublishAot><UseWindowsThreadPool>false</UseWindowsThreadPool><InvariantGlobalization>true</InvariantGlobalization></PropertyGroup>
</Project>

接下来写一段简单的C#代码,故意让一个线程死循环。

internal class Program{static void Main(string[] args){Task.Run(() =>{Test();}).Wait();}static void Test(){var flag = true;while (true){flag = !flag;}}}

这里要注意的一点是发布成AOT的程序不能以普通的带有元数据的C#程序来套。毕竟前者没有元数据了,那怎么办呢?这就考验你对AOT依赖树的理解,熟悉AOT的朋友都知道,依赖树的构建最终是以有向图的方式存储在 _dependencyGraph 字段中,每个节点由基类 NodeFactory 承载,参考代码如下:


public abstract class Compilation : ICompilation
{protected readonly DependencyAnalyzerBase<NodeFactory> _dependencyGraph;
}public abstract partial class NodeFactory
{public virtual void AttachToDependencyGraph(DependencyAnalyzerBase<NodeFactory> graph){ReadyToRunHeader = new ReadyToRunHeaderNode();graph.AddRoot(ReadyToRunHeader, "ReadyToRunHeader is always generated");graph.AddRoot(new ModulesSectionNode(), "ModulesSection is always generated");graph.AddRoot(GCStaticsRegion, "GC StaticsRegion is always generated");graph.AddRoot(ThreadStaticsRegion, "ThreadStaticsRegion is always generated");graph.AddRoot(EagerCctorTable, "EagerCctorTable is always generated");graph.AddRoot(TypeManagerIndirection, "TypeManagerIndirection is always generated");graph.AddRoot(FrozenSegmentRegion, "FrozenSegmentRegion is always generated");graph.AddRoot(InterfaceDispatchCellSection, "Interface dispatch cell section is always generated");graph.AddRoot(ModuleInitializerList, "Module initializer list is always generated");if (_inlinedThreadStatics.IsComputed()){graph.AddRoot(_inlinedThreadStatiscNode, "Inlined threadstatics are used if present");graph.AddRoot(TlsRoot, "Inlined threadstatics are used if present");}ReadyToRunHeader.Add(ReadyToRunSectionType.GCStaticRegion, GCStaticsRegion);ReadyToRunHeader.Add(ReadyToRunSectionType.ThreadStaticRegion, ThreadStaticsRegion);ReadyToRunHeader.Add(ReadyToRunSectionType.EagerCctor, EagerCctorTable);ReadyToRunHeader.Add(ReadyToRunSectionType.TypeManagerIndirection, TypeManagerIndirection);ReadyToRunHeader.Add(ReadyToRunSectionType.FrozenObjectRegion, FrozenSegmentRegion);ReadyToRunHeader.Add(ReadyToRunSectionType.ModuleInitializerList, ModuleInitializerList);var commonFixupsTableNode = new ExternalReferencesTableNode("CommonFixupsTable", this);InteropStubManager.AddToReadyToRunHeader(ReadyToRunHeader, this, commonFixupsTableNode);MetadataManager.AddToReadyToRunHeader(ReadyToRunHeader, this, commonFixupsTableNode);MetadataManager.AttachToDependencyGraph(graph);ReadyToRunHeader.Add(MetadataManager.BlobIdToReadyToRunSection(ReflectionMapBlob.CommonFixupsTable), commonFixupsTableNode);}
}

结合上面的代码,我们的 PortableThreadPool 静态类会记录到根区域的 GCStaticsRegion 中,有了这些知识,接下来就是开挖了。

windbg__173">3. 使用 windbg 开挖

windbg 启动生成好的 aot程序,接下来用 Example_21_8!S_P_CoreLib_System_Threading_PortableThreadPool::__GCSTATICS 找到类中的静态字段。


0:007> dp Example_21_8!S_P_CoreLib_System_Threading_PortableThreadPool::__GCSTATICS L1
00007ff6`e4b7c5d0  000002a5`a4000468
0:007> dp 000002a5`a4000468+0x8 L1
000002a5`a4000470  000002a5`a6809ca0
0:007> dd 000002a5`a6809ca0+0x50 L1
000002a5`a6809cf0  0000000a
0:007> ? a
Evaluate expression: 10 = 00000000`0000000a

从上面的卦中可以清晰的看到,当前的CPU=16%。这里稍微解释下 000002a5a4000468+0x8 是用来跳过vtable从而取到类实例,后面的 000002a5a6809ca0+0x50 是用来获取 PortableThreadPool._cpuUtilization 字段的,布局参考如下:


0:012> !dumpobj /d 27bc100b288
Name:        System.Threading.PortableThreadPool
MethodTable: 00007ffc6c1aa6f8
EEClass:     00007ffc6c186b38
Tracked Type: false
Size:        512(0x200) bytes
File:        C:\Program Files\dotnet\shared\Microsoft.NETCore.App\8.0.8\System.Private.CoreLib.dll
Fields:MT    Field   Offset                 Type VT     Attr            Value Name
00007ffc6c031188  4000d42       50         System.Int32  1 instance                10 _cpuUtilization
00007ffc6c0548b0  4000d43       5c         System.Int16  1 instance               12 _minThreads
00007ffc6c0548b0  4000d44       5e         System.Int16  1 instance            32767 _maxThreads

三:总结

总的来说如果你的AOT使用默认的 WindowsThreadPool,那想获取 cpu利用率基本上是无力回天,当然有达人知道的话可以告知下,如果切到默认的.NET线程池还是有的一拼,即使没有 pdb 符号也可以根据_minThreads和_maxThreads的内容反向搜索。


http://www.ppmy.cn/devtools/125992.html

相关文章

Java Python 开发效率利器:IDEA、PyCharm 与 通义灵码深度融合

随着软件开发行业的快速发展&#xff0c;提高开发效率成为每个程序员追求的目标。在众多开发工具中&#xff0c;IntelliJ IDEA 和 PyCharm 分别作为 Java 和 Python 开发者的首选集成开发环境&#xff08;IDE&#xff09;&#xff0c;因其强大的功能和良好的用户体验而备受青睐…

1-laravel 搭建与路由基础

文章目录 laravel 环境搭建安装工程的命令 基于laravel 开发访问默认欢迎页面第一路由 laravel 环境搭建 借助 phpstudy 搭建环境 安装工程的命令 C:\phpstudy_pro\WWW>composer create-project --prefer-dist laravel/laravel la-3 安装位置 安装…

R语言统计分析——马赛克图

参考资料&#xff1a;R语言实战【第2版】 当变量时类别型变量时&#xff0c;若直观察单个类别型变量&#xff0c;可以使用柱状图或饼图&#xff1b;若存在两个类别型变量或更多时&#xff0c;我们可以使用马赛克图。 在马赛克图中&#xff0c;嵌套矩形面积正比于单元格频率&…

成都睿明智科技有限公司正规吗怎么样?

在数字经济的浪潮中&#xff0c;抖音电商以其独特的内容生态和庞大的用户基础&#xff0c;正逐步成为商家们竞相布局的新蓝海。而在这场电商变革的浪潮中&#xff0c;成都睿明智科技有限公司以其专业的服务和敏锐的市场洞察力&#xff0c;成为了众多商家信赖的合作伙伴&#xf…

02 go语言(golang) - 包和模块

包&#xff08;package&#xff09; 在Go语言中&#xff0c;包&#xff08;package&#xff09;是一种封装代码的方式&#xff0c;用于组织和重用代码。包可以被看作是一个功能模块&#xff0c;它可以包含函数、变量、类型&#xff08;如结构体和接口&#xff09;以及其他包。…

利用TDM在vscode中运行c语言

1. 安装 VSCode 如果你还没有安装 VSCode&#xff0c;可以从 VSCode 官网 下载并安装。 2. 安装 C/C 扩展 打开 VSCode。点击左侧边栏的扩展图标&#xff08;四个小方块组成的图标&#xff09;&#xff0c;或者按 Ctrl Shift X。在搜索框中输入 C/C&#xff0c;然后安装由…

Leetcode 数组中第 k 大的元素

使用最小堆 (min-heap) 来解决该问题 代码逻辑&#xff1a; 初始化最小堆并插入前 K 个元素&#xff1a; 首先&#xff0c;将数组的前 K 个元素插入到堆中。此时&#xff0c;堆的大小为 K&#xff0c;堆顶元素是这 K 个元素中最小的。 遍历剩余的数组元素&#xff1a; 对于数…

基于协同过滤的景区旅游可视化与景区推荐系统(自动爬虫,地点可换)

文章目录 有需要本项目的代码或文档以及全部资源&#xff0c;或者部署调试可以私信博主项目介绍过程展示项目移植每文一语 有需要本项目的代码或文档以及全部资源&#xff0c;或者部署调试可以私信博主 项目介绍 本项目是一个综合性的旅游景区数据管理与分析推荐系统,集成了用…