Compute Express Link (CXL) 是一项旨在提高数据中心和高性能计算环境中CPU、内存及加速器之间通信效率的技术。尽管自2019年以来就已经存在并开始被一些产品使用,但直到2025年,CXL才有望从一个非常小众的技术转变为常规技术,广泛应用于现代服务器中。
CXL相关扩展阅读:
一、CXL的发展历程
2019年英特尔开始将CXL技术从公司内部转移到行业联盟,并首次公开讨论该技术。此时,AMD尚未发布EPYC 7002系列“Rome”处理器,NVIDIA也未通过AI芯片彻底改变市场格局,英特尔在提供此类技术方面仍占据主导地位。
就在这一年,英特尔开始将Compute Express Link (CXL) 技术从公司内部转移到一个行业联盟中。这标志着CXL技术正式进入公众视野,并开始了其标准化和推广的过程。在2019年4月的Interconnect Day上,英特尔展示了其以太网为中心的互连图谱,这期间正值英特尔未能成功收购Mellanox Technologies。此外,英特尔选择了优先发展CXL/PCIe技术,而不是扩展UPI(如NVLink或UALink)等其他互连方案。
CXL旨在通过统一内存地址空间来提高CPU、加速器和内存之间的通信效率,同时保持低延迟和高带宽。这一特性使其成为数据中心和高性能计算环境中非常有吸引力的选择。到2021年,CXL技术已经赢得了广泛的认可,并且产品化步伐加快。业界普遍认为CXL是未来互连技术的重要组成部分,它不仅能够增强现有系统的性能,还为未来的创新提供了基础。
2022年,AMD推出了支持CXL Type-3内存扩展设备的EPYC Genoa处理器。这使得AMD成为了首批将CXL技术引入市场的厂商之一。
相比之下,英特尔在其第四代Xeon Scalable “Sapphire Rapids”处理器中并未包含对CXL Type-3设备的支持,尽管这些芯片本身可以工作在CXL模式下。
直到大约一年后,即2023年,随着第五代Intel Xeon处理器“Emerald Rapids”的推出,英特尔才正式加入了对CXL Type-3设备的支持。这意味着英特尔比AMD晚了一年才实现这一功能。
经过过去一两年的发展,我们已经看到了支持CXL Type-3设备的芯片组和服务器世代相继问世,同时也建立起了一个完整的设备生态系统。这意味着现在正是开始探索和应用CXL技术的最佳时机。对于追求高效能计算能力且希望优化资源利用的数据中心而言,CXL无疑是一项值得关注并积极采纳的技术进步。
CXL Type-3设备主要用于内存扩展,它利用现有的PCIe通道来连接CXL内存控制器和附加的DRAM。具体来说:
-
CXL通道:这些设备使用的是原本为PCIe预留的物理通道,但它们运行在CXL协议下,以确保低延迟和高带宽的数据传输。
-
CXL内存控制器:这是一个专用的硬件组件,负责管理连接到它的DRAM模块,提供统一的内存地址空间给CPU和其他CXL设备访问。
二、实际应用案例
1. 类似SSD形态的CXL内存模块
Micron推出的CZ120 CXL内存扩展模块就是一个很好的例子。这类模块外观类似于传统的SSD,可以插入E3.S或E3.L EDSFF驱动托架中。这不仅简化了安装过程,还使得数据中心能够轻松地进行内存扩展,而无需改变现有的基础设施布局。
2. PCIe卡形式的内存扩展卡
Astera Labs的Leo CXL内存扩展卡展示了另一种形式的CXL Type-3设备。这种设计采用标准PCIe卡的形式,可以直接插入服务器主板上的插槽中,同时携带多个DIMM插槽用于安装额外的DRAM模块。这种方式提供了更高的灵活性,特别是在需要快速部署或定制化配置时。
3. 高密度内存扩展解决方案
Lenovo ThinkSystem SR860 V3是专为大规模内存工作负载设计的一款服务器,内置了多达128个128GB DDR5 DIMM插槽。借助CXL技术,该服务器可以在不增加CPU数量的情况下显著提升系统的总内存容量,非常适合运行如SAP HANA等需要大量内存的应用程序。
4. 定制化多服务器架构
ASUS展示了一种创新的AMD EPYC CXL内存启用服务器,它在一个机箱内集成了四个独立的服务器节点以及若干个内存扩展模块。这样的设计允许用户根据实际需求灵活分配资源,提高了系统的利用率和性能。
5. 独立式内存扩展
Inventec的96 DIMM CXL扩展盒提供了一个专门的机箱来容纳大量的DDR5或DDR4内存模块,并可通过CXL接口连接到一台或多台服务器。这种方案特别适合超大规模数据中心,因为它能够在不影响现有服务器硬件的前提下,动态地分配内存资源。
CXL 2.0及未来发展方向
随着CXL 2.0规范的引入,我们现在有了通往更复杂网络拓扑结构的道路,特别是当涉及到PCIe Gen6/CXL 3.x版本时。例如,XConn SC50256 CXL 2.0交换芯片使得我们可以构建一个基于交换架构的系统,其中内存货架可以被动态分配给不同的服务器节点,从而实现了更加灵活高效的资源管理。
值得注意的是,CXL技术不仅仅带来了性能上的提升,它还在成本控制和环境保护方面发挥了重要作用。例如,Marvell Structura A2504 DDR4 CXL控制器允许重新利用旧的DDR4内存模块,减少了新模块的采购成本,并降低了制造过程中产生的碳排放。
此外,在FMS峰会上,Kioxia展示了结合CXL技术和BiCS Flash SSD的产品,为那些寻求替代传统DRAM方案的企业提供了新的选择。
为了加速CXL技术的大规模应用,行业内的共识是让CXL Type-3设备具备类似于SSD的“即插即用”特性:
-
简化配置流程:减少或消除繁琐的手动设置步骤,使得任何符合条件的CXL设备插入后能够自动识别并正确配置。
-
增强互操作性:确保不同品牌、型号之间的广泛兼容性,无论是在硬件层面还是软件层面,都能够无缝协作。
-
提供统一标准:通过制定更加严格的规范,保证所有参与者都能遵循相同的标准进行开发和生产,从而提高整体稳定性和安全性。
预计在2025年,我们将看到更多支持CXL的服务器设计出现,特别是在那些需要额外内存和更高带宽的一般用途计算环境中。这标志着CXL技术正在逐步走向成熟,变得更加易于部署。
到2027年左右,CXL有望迎来大规模采用,并且开始涉及到一些更为酷炫的应用案例,如AI训练、高性能计算集群等。然而,值得注意的是,目前CXL并不是AI基础设施建设的主要组成部分,因此其在这方面的普及可能还需要一段时间。
随着技术的进步和市场的接受度不断提高,CXL不仅会改变现有的数据中心架构,还将开启一系列新的可能性,例如动态资源分配、跨节点内存共享等。
实现CXL Type-3设备的“即插即用”体验是推动该技术广泛应用的关键一步。虽然我们已经在正确的道路上前进,但仍需克服一些技术和操作上的障碍。通过持续的努力和合作,相信不久将来,CXL将成为构建高效能、低成本的数据中心不可或缺的一部分。对于追求卓越性能同时又注重灵活性和可维护性的企业和组织来说,这是一个值得期待的技术进步。
如果您看完有所受益,欢迎点击文章底部左下角“关注”并点击“分享”、“在看”,非常感谢!
精彩推荐: