垃圾回收 (GC) 在 .NET Core 中是如何工作的?

news/2024/11/20 7:11:00/

        提起GC大家肯定不陌生,但是让大家是说一下GC是怎么运行的,可能大多数人都不太清楚,这也很正常,因为GC这东西在.NET基本不用开发者关注,它是依靠程序自动判断来释放托管堆的,我们基本不需要主动调用Collect()释放内存,只需要注意对非托管资源进行及时释放就行。

        虽说我们不用关注GC的运行,但是作为一个合格的程序员,还是有必要知道她是怎么工作的,因为垃圾回收对于一个程序来说真的太重要了,下面我们就用实际的应用来看下GC在.NET Core下是怎么工作的:

GC 会分配堆段,其中每个段都是一系列连续的内存。 置于堆中的对象归类为 3 个代系之一:0、1 或 2。 代系可确定 GC 尝试在应用不再引用的托管对象上释放内存的频率。 编号较低的代系会更加频繁地进行 GC。

对象会基于其生存期从一个代系移到另一个代系。 随着对象生存期延长,它们会移到较高代系。 如前所述,较高代系进行 GC 的频率较低。 短期生存的对象始终保留在第 0 代中。 例如,在 Web 请求存在期间引用的对象的生存期较短。 应用程序级别单一实例通常会迁移到第 2 代。

当 ASP.NET Core 应用启动时,GC 会:

  • 为初始堆段保留一些内存。
  • 在运行时加载时提交一小部分内存。

进行以上内存分配是出于性能方面的原因。 性能优势来自连续内存中的堆段。

GitHub 上提供了 MemoryLeak 示例应用。 MemoryLeak 应用:

运行起来是这样的

  • Allocated:托管对象占用的内存量(当前系统认为要分配内存量)
  • Working set:进程的虚拟地址空间中当前驻留在物理内存中的页集。 显示的工作集与任务管理器显示的值相同。(为当前进程分配的物理内存量)
  • Gen 0:表示第0代堆段被回收
  • Gen 1:表示第1代堆段被回收(同时回收0、1代)
  • Gen 2:表示第2代堆段被回收(同时回收0、1、2代)
  • RPS:每秒请求数

GC = Server  asp.net 默认的是服务端GC

示例提供了很多接口用于调用测试

暂时性对象

我们先来看一下第一个接口:

[HttpGet("bigstring")]
public ActionResult<string> GetBigString()
{return new String('x', 10 * 1024);
}

创建一个 10-KB 字符串实例,并将它返回给客户端。 对于每个请求,会在内存中分配一个新对象并将它写入响应中。 字符串作为 UTF-16 字符存储在 .NET 中,因此每个字符都需要 2 字节内存。

使用压力测试工具Apache JMeter - Apache JMeter™

对这个接口进行压力测试,来观察内存使用情况

运行压力测试工具后可以看到内存使用及GC运行情况:

可以看到RPS在3K左右,当内存使用量升到了100M左右GC进行了第0代垃圾回收,第 0 代 GC 回收大约每两秒进行一次,内存消耗和释放(通过 GC)是稳定的,很少出现第1代回收,是因为分配的内存都是临时的小内存,并发量也在程序的可处理范围内,基本在第0代就可以完全回收。

持久性对象引用

接下来看下一个接口:

private static ConcurrentBag<string> _staticStrings = new ConcurrentBag<string>();[HttpGet("staticstring")]public ActionResult<string> GetStaticString(){var bigString = new String('x', 10 * 1024);_staticStrings.Add(bigString);return bigString;}

GC 无法释放上面的静态资源对象。 引用了不再需要的对象会导致内存泄露。 如果应用经常分配对象,但在不再需要对象之后未能释放它们,则内存使用量会随着时间推移而增加。

上面的 API 创建一个 10-KB 字符串实例,并将它返回给客户端。 与上一个示例的不同之处在于,此实例由静态成员引用,这意味着它不能被GC回收。

运行压力测试工具后可以看到内存使用及GC运行情况:

在上图中:

  • /api/staticstring进行压力测试,会导致内存线性增加。
  • GC 会在内存压力增加时,通过调用Collect来尝试释放内存,但是基本无济于事。
  • GC 无法释放泄漏的内存。 已分配内存和工作集会随时间而增加。

停止压力测试后内存还在持续占用,手动调用Collect()也无济于事

我们只能调用Clear()来清理静态资源,然后Collect()进行回收

[HttpGet("clear")]public ActionResult<string> Clear(){_staticStrings.Clear();GC.Collect();GC.WaitForPendingFinalizers();GC.Collect();return "";}

本机内存

来看下一个接口:

[HttpGet("fileprovider")]
public void GetFileProvider()
{var fp = new PhysicalFileProvider(TempPath);fp.Watch("*.*");
}

某些 .NET Core 对象依赖于本机内存。 GC 无法回收本机内存。 使用本机内存的 .NET 对象必须使用本机代码进行释放。

.NET 提供了 IDisposable 接口,使开发人员能够释放本机内存。 即使未调用 Dispose,正确实现的类也会在终结器运行时调用 Dispose

PhysicalFileProvider 是托管类,因此任何实例在请求结束时都会被回收。

运行压力测试工具后可以看到内存使用及GC运行情况:

上面的图表显示此类的实现存在一个明显问题,它会不断增加内存使用量,这是因为忘记调用应释放的相关对象的 Dispose 方法

我改一下这个接口,使用using调用Dispose :

private static readonly string TempPath = Path.GetTempPath();[HttpGet("fileprovider")]public void GetFileProvider(){using (var fp = new PhysicalFileProvider(TempPath)){fp.Watch("*.*");}               }

可以看到内存得到了稳定的释放,GC调用也相对稳定

大型对象堆

频繁的内存分配/释放周期可能会导致内存碎片,尤其是在分配大型内存区块时。 对象在连续内存块中进行分配。 为了减少碎片,当 GC 释放内存时,它会尝试对其进行碎片整理。 此过程称为压缩。 压缩涉及移动对象。 移动大型对象会造成性能损失。 因此,GC 会为大型对象创建特殊内存区域,称为大型对象堆 (LOH)。 大于 85,000 字节(大约 83 KB)的对象:

  • 置于 LOH 上。
  • 不进行压缩。
  • 在第 2 代 GC 期间进行回收。

当 LOH 已满时,GC 会触发第 2 代回收。 第 2 代回收:

  • 在本质上速度较慢。
  • 还会产生对所有其他代系触发回收的成本。

下面的代码会立即压缩 LOH:

GCSettings.LargeObjectHeapCompactionMode = GCLargeObjectHeapCompactionMode.CompactOnce;
GC.Collect();

在使用 .NET Core 3.0 及更高版本的容器中,LOH 会自动压缩。

我们来看下一个api:

[HttpGet("loh/{size=85000}")]
public int GetLOH1(int size)
{return new byte[size].Length;
}

用压力测试工具调用 /api/loh/84975 这个接口

换一下对象大小 调用 /api/loh/84976 这个接口

比较上面两个图表

  • 工作集对于这两种方案是相似的(大约 450 MB)。
  • 低于 LOH 请求(84,975 字节)大部分显示第 0 代回收。
  • 高于 LOH 请求(84,976 字节)生成恒定的第 2 代回收。 第 2 代回收成本高昂。 需要更多 CPU

 84,976 字节会就触发了 85,000 限制

所以临时大型对象有性能问题,因为它们会导致第 2 代 GC。

为了获得最佳性能,应最大程度减少大型对象使用。 如果可能,请拆分大型对象。 例如,ASP.NET Core 中的响应缓存中间件会将缓存项拆分为小于 85,000 字节的块。


http://www.ppmy.cn/news/1273520.html

相关文章

【Java基础】HashMap 原理

文章目录 1、HashMap 设置值的原理2、HashMap 获取值原理3、HashMap Hash优化4、HashMap 寻址优化5、HashMap 是如何解决Hash冲突的&#xff1f;5.1 get数据的时候&#xff0c;如果定位到指定位置的元素是一个链表&#xff0c;怎么办呢&#xff1f;5.2 红黑树 6、数组扩容6.1 数…

数据仓库与数据挖掘小结

更加详细的只找得到pdf版本 填空10分 判断并改错10分 计算8分 综合20分 客观题 填空10分 判断并改错10分--错的要改 mooc中的--尤其考试题 名词解释12分 4个&#xff0c;每个3分 经常碰到的专业术语 简答题40分 5个&#xff0c;每道8分 综合 画roc曲线 …

什么是计算机网络?计算机网络基础知识

1.网络的组成部分&#xff1a;由主机&#xff0c;路由器&#xff0c;交换机等组成 2.网络结构&#xff1a;网络的网络 3.信息交换方式&#xff1a;电路交换和分组交换 4.网络分层&#xff1a;分清职责&#xff0c;物理层&#xff0c;链路层&#xff0c;网络层&#xff0c;运…

SpringBoot 整合 ExcelEasy

ExcelEasy 是一个基于 Spring Boot 的 Excel 导入导出框架&#xff0c;它提供了简单易用的 API 来操作 Excel 文件&#xff0c;可以轻松实现 Excel 的导入导出。 1. 添加依赖 在 pom.xml 文件中添加 ExcelEasy 的依赖&#xff1a; <dependency><groupId>com.ali…

Linux 之 性能优化

uptime $ uptime -p up 1 week, 1 day, 21 hours, 27 minutes$ uptime12:04:11 up 8 days, 21:27, 1 user, load average: 0.54, 0.32, 0.23“12:04:11” 表示当前时间“up 8 days, 21:27,” 表示运行了多长时间“load average: 0.54, 0.32, 0.23”“1 user” 表示 正在登录…

频谱论文:面向频谱地图构建的频谱态势生成技术研究

#频谱# [1]李竟铭.面向频谱地图构建的频谱态势生成技术研究.2019.南京航空航天大学,MA thesis.doi:10.27239/d.cnki.gnhhu.2019.000556. &#xff08;南京航空航天大学&#xff09; 频谱地图是对无线电环境的抽象表达&#xff0c;它可以直观、多维度地展现频谱态势信息&…

数据修复:.BlackBit勒索病毒来袭,安全应对方法解析

导言&#xff1a; 黑色数字罪犯的新玩具——.BlackBit勒索病毒&#xff0c;近来成为网络安全领域的头号威胁。这种恶意软件以其高度隐秘性和毁灭性而引起广泛关注。下面是关于.BlackBit勒索病毒的详细介绍&#xff0c;如不幸感染这个勒索病毒&#xff0c;您可添加我们的技术服…

C 库函数 - time()

描述 C 库函数 time_t time(time_t *seconds) 返回自纪元 Epoch&#xff08;1970-01-01 00:00:00 UTC&#xff09;起经过的时间&#xff0c;以秒为单位。如果 seconds 不为空&#xff0c;则返回值也存储在变量 seconds 中。 声明 下面是 time() 函数的声明。 time_t time(t…