首页 > 其他分享 >.NET8 极致性能优化 Non-GC Heap

.NET8 极致性能优化 Non-GC Heap

时间:2023-11-26 23:44:06浏览次数:52  
标签:Non 对象 mov GC Heap public rax

前言

.NET8 里面 JIT 引入了一个新的机制,叫做 Non-GC Heap。JIT 可以确保相关对象分配在 Non-GC Heap 上,该堆像其名称一样,不受 GC 管理。JIT 需要保证这个对象没有被 GC 引用,并且在这个对象的生命周期内一直是根对象 (不会被 GC 消灭的对象) 的状态。原文:.NET8 极致性能优化 Non-GC Heap

概述

为什么要引入这种机制?先来看一段代码:

public static string GetPrefix() => "https://";
static void Main(string[] args)
{
  GetPrefix ();
}

这里的 GetPrefix 函数返回的是一个常量字符串值,它的 ASM 如下:

mov  rax,185CAC02068h
mov  rax,qword ptr [rax]

两个 mov 指令,第一个是对象指针的指针,第二个是对象的指针。虽然是简单的两个指令,但是背后的逻辑却较为复杂,基本如下:
一个字符串常量值,.NET7 里面 JIT 也会给这个字符串常量值复制到一个堆分配到字符串对象中,返回的是对象的二级指针。因为是堆对象,可能会被 GC 移动,每次都需要获取新的地址,频繁增加负担。

这里的问题在哪儿呢?一个字符串常量值需要这么多的步骤操作吗?开销是否太大,我们是否可以简化它呢?有一个常规的很容易想到的方法,就是把这个字符串常量值的地址给它固定起来,每次需要用到这个常量值,就直接去这个固定地址读取,这样行不行呢?GC 堆很明显不能硬编码固定。

当然可以,做法就是把这个字符串常量值放到 POH (固定对象堆) 上,不让 GC 移动。这样是减少了 GC 回收的时候移动的开销,但是并没有从根本上解决问题,因为固定对象同样受到 GC 的管控,上面的步骤除了不能移动一样不少,并且 POH 不会进行根对象的处理,可能会导致它们被回收,地址指向了其它的数据,进而错误。

特点

要彻底的解决这个问题,本篇的主角:Non-GC Heap 出场了。它有三个特点:
1.JIT 要保证这个对象没有被 GC 引用
2. 这个对象在生命周期内一直是根对象
3. 它不能是可卸载上下文的一部分

你可以认为 GC 堆包括:小对象堆 (SOH - 小于 85000 字节的对象),大对象堆 (LOH - 大于 85000 字节的对象),固定对象堆(POH)
而 No-GC Heap 超脱于 GC Heap 之外的 FOH (冻结堆)。

JIT 现在可以避免在生成的代码中访问该对象时的间接寻址,而是直接硬编码对象的地址

GetPrefix 函数的 ASM 在.NET8 Non-GC Heap 里面如下:

mov  rax,26180000218h
C3   ret

26180000218h 为对象地址,一个 mov 直接返回。看似只简化了一个 mov, 但是实际上它这种硬编码固定模式地址,简化的是整个字符串常量值的原理,也就是把字符串常量值分配到 FOH 里面,而不是 GC 堆里。性能极大的提升自不必多说。以下测量 13 倍的性能提升。

Method Job Mean Ratio
GetPrefix .NET 7 1.3450 ns
GetPrefix .NET 8 0.0729 ns

其它 Non-GC Heap 的操作

一: 使用 typeof (T) 生成的 RuntimeType 对象

public Type GetTestsType() => typeof(Tests);

二: 空数组分配到 Non-GC Heap 上,使 Array.Empty () 更加高效

public string[] Test() => Array.Empty<string>();

它俩在.NET8 里面都类似于如下 ASM,一个 mov 直接返回:

mov rax,1A0814EAEA8
ret

三: 静态值类型字段关联的堆对象,不包含任何 GC 引用的字段

public partial class Tests
{
    private static readonly ConfigurationData s_config = ConfigurationData.ReadData();
    public TimeSpan GetRefreshInterval() => s_config.RefreshInterval;
    private struct ConfigurationData
    {
        public static ConfigurationData ReadData() => new ConfigurationData
        {
            Index = 0x12345,
            Id = Guid.NewGuid(),
            IsEnabled = true,
            RefreshInterval = TimeSpan.FromSeconds(100)
        };
        public int Index;
        public Guid Id;
        public bool IsEnabled;
        public TimeSpan RefreshInterval;
    }
}

RefreshInterval .NET7 如下:

mov       rax,13D84001F78
mov       rax,[rax]
mov       rax,[rax+20]
ret

RefreshInterval .NET8 如下:

mov       rax,20D9853AE48
mov       rax,[rax]
ret

四: 代之间的 GC 引用判断

代码:

public class Tests
{
    public void Write()
    {
        string dst = "old";
        Write(ref dst, "new");
    }

    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void Write(ref string dst, string s) => dst = s;
}

Write 在.NET7 和.NET8 上生成如下:

call      CORINFO_HELP_CHECKED_ASSIGN_REF
nop
ret

CORINFO_HELP_CHECKED_ASSIGN_REF 是一个 JIT 帮助程序函数,其中包含所谓的 “GC write barrier (GC 写屏障)”,一个小代码片段,用于让 GC 跟踪正在写入的引用,因为它可能需要知道,例如,因为正在分配的对象可能是 gen0,而目标可能是 gen2。

微调下这个代码:

public class Tests
{
    public void Write()
    {
        string dst = "old";
        Write(ref dst);
    }

    [MethodImpl(MethodImplOptions.NoInlining)]
    private static void Write(ref string dst) => dst = "new";
}
  • 实现的功能都是一样的,只不过 dst 直接赋值了常量字符串,记得上面常量字符串的分配是在 Non-GC Heap 吗?.NET7 里面还是需要帮助函数:
mov       rdx,1FF0E4014A0
mov       rdx,[rdx]
call      CORINFO_HELP_CHECKED_ASSIGN_REF
nop
ret

然.NET8 里面则是

mov       rax,1B3814EAEC8
mov       [rcx],rax
ret

因为.NET8 意识到常量字符串是在 Non-GC Heap,不需要 GC 跟踪判断在那个代码,类似于 card_table 那种。所以优化掉了 CORINFO_HELP_CHECKED_ASSIGN_REF

标签:Non,对象,mov,GC,Heap,public,rax
From: https://www.cnblogs.com/lzhdim/p/17858245.html

相关文章

  • WGCLOUD 基础详解 常用命令笔记
    WGCLOUD在v3.4.9版本新增了一个模块【常用命令笔记】这个模块非常有用,对我的工作非常有帮助,可以把我常用的一些命令或文档记录下来,也可以当作记事本使用,记录一些笔记使用简单,而且方便......
  • 运维平台 WGCLOUD v3.4.9 支持配置告警恢复通知脚本
    WGCLOUD在v3.4.9版本新增一个特性就是可以配置告警恢复脚本,这样如果有恢复通知,就会通过这个脚本发送。告警通知还是通过告警脚本来发送这样可以更好的区分处理告警消息告警恢复脚本不是必须配置的,如果配置了告警恢复脚本,那么此脚本只会发送恢复通知,不会发送告警通知消息使用场景,......
  • .NET8极致性能优化Non-GC Heap
    前言.NET8里面JIT引入了一个新的机制,叫做Non-GCHeap。JIT可以确保相关对象分配在Non-GCHeap上,该堆像其名称一样,不受GC管理。JIT需要保证这个对象没有被GC引用,并且在这个对象的生命周期内一直是根对象(不会被GC消灭的对象)的状态。原文:.NET8极致性能优化Non-GCHeap概述为什......
  • 【行行AI公开课】AIGC从模型到落地:促进技术落地与产业变革
    11月26日北京大学的北大创新学社将举行“AI-FUSION”系列活动第十期。北大创新学社是北京大学团委和光华管理学院团委指导成立,是2023HICOOL全球创业者峰会唯一受邀参展的高校社团。“首都高校创新创业大赛”发起方及主办单位。“AI-FUSION”是AI创投部人工智能行业社群打造的系列......
  • springcloud学生选课系统
    开发技术:jdk1.8,mysql5.7,idea,nodejs,vscodespringcloudspringbootmybatisvueelementui功能介绍:学生:登录,统计分析,选课(查看课程及选择),我的成绩老师:登录,统计分析,课程管理:课程信息维护成绩管理:成绩信息发布管理员:登录统计分析:统计成绩学生管理:学生增删改查老师管理:老师增删改查班级管......
  • 鸿蒙原生应用/元服务开发-AGC分发如何上架HarmonyOS应用
    一、上架整体流程二、上架HarmonyOS应用获取到HarmonyOS应用软件包后,开发者可将应用提交至AGC申请上架。上架成功后,用户即可在华为应用市场搜索获取开发者的HarmonyOS应用。配置应用信息1.登录AppGalleryConnect,选择“我的应用”。2.在应用列表首页中选择“HarmonyOS”页签,点击待......
  • AI未来发展6大趋势,国内AIGC法规正式实施,大模型开始接入移动设备 | AIGC 月报速览
    本期导览行业动态◾初心资本分享AI未来发展的六大趋势◾行业普遍认为AIGC可以提升工作效率◾AI芯片需求庞大,国内外公司都在大量下单抢购◾国内外公司纷纷开始狂招AI人才◾OpenAI推出企业版,GPT-3.5-turbo推出微调功能◾Midjourney新增Vary功能,升级GPU集群相关政......
  • Full GC
    1、fullgc主要干了什么?JVMFullGC(FullGarbageCollection)是一种垃圾回收的机制,用于回收整个堆内存中的所有未使用对象,包括年轻代和老年代中的对象。在进行FullGC时,主要会做以下几件事情:(1)停止所有的应用程序线程:为了避免在FullGC期间产生新的垃圾对象,JVM需要先暂停所有的应......
  • 【AGC】元服务开放式测试找不到服务的问题
    ​【问题描述】开发者开发元服务,想要在正式上架前进行测试,于是选择了AGC的开放式测试功能,可以指定人员参与上架后的测试。但是开发者在开放式测试审核成功后,无法在应用市场查找到该服务,其实出现这个问题的原因有很多,接下来就一个一个进行排查。 【问题分析】1.     首先......
  • Soul CEO张璐深耕AIGC领域,为行业数字化发展提供创新样本
    随着AIGC技术的快速发展,人工智能进入2.0时代。AIGC技术融合了GAN、CLIP、Transformer、Diffusion、预训练模型、多模态技术、生成算法等多种技术,具有强大的基础能力和通用性,正逐渐成为各大互联网巨头争相竞争的赛道。据艾瑞咨询预测,中国AIGC产业规模2023年约为143亿元,2028年预......