[转帖]ARM发布新一代高性能处理器N3/V3

时间：2024-03-28 13:47:33浏览次数：24

标签：架构 AI 转帖 V2 V3 N3 ARM

https://zhuanlan.zhihu.com/p/371282138

就在2月21日，ARM发布了新一代面向服务器的高性能处理器N3和V3，N系列平衡性能和功耗，而V系列则注重更高的性能。此次发布的N3，单个die最高32核（并加入到CCS，Compute Subsystems，包含Core，System Ip等），以CCS来讨论，每瓦性能比上一代提升20%-50%。而Neoverse V3，单个die最高64核（加入CCS），ARM似乎更强调其AI相关的分析能力，并于Neoverse V2 相比，Neoverse V3 在机器学习方面提供了+96%的性能提升，在RDBMS上提供了+16%的性能提升，在加密货币方面提供了+9%的性能提升，在整数工作负载方面提供了+12% 的性能提升。与此同时，相关的系统IP同时发布，例如新一代的CMN S3，这将取代前一代的CMN700，但没有更多的信息。

2V3微架构的改变

Neoverse™ V3处理器应用 Arm®v9.2-A架构，Core接口使用DSU-120，Core总体性能提升没有官方数据，部分分析认为相比较前代提升大约在10~20%。

MMU

MMU，左为V3，右为V2

MMU仍然延续经典的2级TLB结构，更细节的微架构设计手册没有过多的描述，Translation Cache，聚合，预取等传统技术依然存在，对于L2 TLB，3代微架构没有明显的改变。最大的改变是 L1 TLB，其中ITLB的entry从V2的48entry升级到V3的128entry，而DTLB 从48entry升级为96entry。最具特点的是ITLB的巨大升级，可能是为了应对AI场景下，指令集地址变化更频繁。这也是为什么ARM对V3更强调AI场景的分析。

L1 Cache

ICache，上为V3，下为V2

ICache的改变主要在V3抛弃了Macro-Operation Cache（手册没提，应该是放弃了），这里亦安分析可能是对于精简指令集，这种做法性价比不高，或者设计确实没有达到理想的状态，再者，ARM本身非常关注功耗，所以在V3处理器版本抛弃了这种微架构。手机端A77，A78，X1，X2，X3均具有MOPCache，X4放弃该微架构。

DCache在参数上描述无差异。

L2 Cache

L2 cache,上V3，下V2

L2从官方描述上看，从原来的V2（1-2MB）升级V3（2-3MB），其它参数没有明显变化，详细的微架构尚不清楚。

3总结

由于V3/N3刚刚发布，其它例如预测器，乱序等模块的微架构尚不清晰，等待公布更多信息再聊，除去按照惯例的性能提升描述，比较值得关注的是ARM对处理器涉及AI分析的强调，由此可以知道近几年AI发展对整个芯片行业的巨大冲击，似乎只有往AI上靠，才会获得市场的青睐，这一场AI争夺战已经进入白热化，芯片行业本身就处在中心。

标签：架构,AI,转帖,V2,V3,N3,ARM
From： https://www.cnblogs.com/jinanxiaolaohu/p/18101455

[转帖]Arm更新Neoverse产品路线图：N3/V3内核曝光，能效及AI性能大涨
https://new.qq.com/rain/a/20240222A0495O00 +关注2月22日，半导体IP大厂Arm宣布推出新一代ArmNeoverse技术。其中包括，通过性能效率更优异的N系列新IP扩展ArmNeoverse计算子系统(CSS)产品路线图。与NeoverseCSSN2相比，NeoverseCSSN3的每瓦性能可提高......
[转帖]PCIe7.0宣布即将2025推出
https://zhuanlan.zhihu.com/p/532935941 jiu导言在2022年的PCI-SIG的开发者大会上，PCI-SIG总裁庆祝了PCI-SIG成立30周年并宣布PCIe技术的下一代技术展望，并且计划在2025年向成员发布PCIe7.0标准。而在未来3年中即将推出的PCIe7.0再次提供速度提升（相比较PCIe6.0翻倍，X16双......
[转帖]比黄金更贵的显卡，疯狂H100
https://zhuanlan.zhihu.com/p/654361974 华尔街和硅谷联袂奉上了一件震撼业界的大事：让一家创业公司拿到23亿美元的债务融资，抵押物则是当前全球最硬的通货——H100显卡。这个大事件的主角叫做CoreWeave，主营业务是AI私有云服务，简单说就是通过搭建拥有大量GPU算力的数据中......
python3安装pandas库出现Could not import the lzma module
1.安装lzma模块使用：python-mpipinstallbackports.lzma2.进入cd/usr/local/python3/lib/python3.7目录（系统不同，目录也有所不同，可以通过which命令来查找当前运行python是使用的那个目录的），然后编辑lzma.py，将下面代码:from_lzmaimport*from_lzmaimport_encode_......
[转帖]尝试梳理下ARM处理器的发展历史
大家好，这篇文章是我的朋友MichaelYao写的，我觉得非常不错，分享给大家。1.前言本文尝试简单梳理下ARM处理器的发展历史、架构的演进，包括不同处理器的应用方向，但我们重点还是围绕Cortex-A系列展开，也会介绍不同微架构处理器之间的继承关系，以及它们分别出自哪个设计团队等。不出......
[转帖]SPECjbb MultiJVM - Java Performance
MovingonfromSPECCPU,weshiftovertoSPECjbb2015.SPECjbbisafromground-updevelopedbenchmarkthataimstocoverbothJavaperformanceandserver-likeworkloads,fromtheSPECwebsite:“TheSPECjbb2015benchmarkisbasedontheusagemodelofa......
John Deere Service Advisor EDL V3 Electronic Data Link Diagnostic Kit
JohnDeereServiceAdvisorEDLV3ElectronicDataLinkDiagnosticKitisapowerfultooldesignedspecificallyforheavy-dutymachineryusedinconstruction,agriculture,enginesbyJohnDeere.Thisdiagnosticadapterisessentialfortechniciansandoper......
java毕业设计商城平台（Springboot+mysql+jdk1.8+maven3.39）
本系统（程序+源码）带文档lw万字以上文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景：随着互联网技术的迅猛发展和电子商务的蓬勃兴起，商城平台已经成为人们日常生活中不可或缺的一部分。从服装、电子产品到食品、日用品等，几乎任何想得到的商......
java毕业设计体检中心信息管理系统（Springboot+mysql+jdk1.8+maven3.39）
本系统（程序+源码）带文档lw万字以上文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景：随着人们健康意识的增强和医疗保健水平的提高，体检成为现代生活中不可或缺的一部分。体检中心作为提供专业健康检查服务的机构，其信息管理效率和服务质量直......
java毕业设计商洛市尾矿资源管理系统（Springboot+mysql+jdk1.8+maven3.39）
本系统（程序+源码）带文档lw万字以上文末可领取本课题的JAVA源码参考系统程序文件列表系统的选题背景和意义选题背景：商洛市位于中国陕西省东南部，该地区矿产资源丰富，历史上矿业开采活动频繁。然而，随着矿产资源的不断开发利用，产生了大量的尾矿。尾矿如果处理不当，不仅会造成......

[转帖]ARM发布新一代高性能处理器N3/V3

2V3微架构的改变

MMU

L1 Cache

L2 Cache

3总结

相关文章

赞助商

阅读排行