首页 > 其他分享 >AMD在新的MLPerf基准测试中缩小了与Nvidia的差距

AMD在新的MLPerf基准测试中缩小了与Nvidia的差距

时间:2024-08-29 11:26:07浏览次数:6  
标签:AI 基准 AMD MLPerf 测试 Nvidia

AMD、Untether AI、Google、Intel和Nvidia的新基准测试结果显示,AI硅片性能竞争日趋激烈。然而,系统设计、网络和软件使AI大放异彩,而这正是Nvidia的强项。

终于,我可以停止抱怨AMD缺乏公开的AI基准测试了。AMD发布了其MI300 GPU的优秀MLPerf推理结果,虽然只在一个基准测试上与Nvidia H100竞争。加拿大初创公司Untether.ai也发布了新的推理基准测试,展示其能效。让我们来看看。

MLPerf推理4.1基准测试套件

控制和发布MLPerf基准测试的MLCommons行业联盟扩展了每年两次的推理基准测试套件,增加了一个新的基准测试,用于日益流行的专家混合(MoE)AI模型。MoE模型结合了多个模型,以提高准确性并降低大型语言模型(LLM)如OpenAI的GPT-4的训练成本。虽然AMD没有发布MoE基准测试,但既然他们已经打开了基准测试的大门,AMD发言人表示我们很快会看到更多的基准测试结果。

看到新处理器的MLPerf提交确实令人鼓舞。具体来说,除了Nvidia的Blackwell和AMD的首次提交之外,我们现在还有Untether.ai、AMD下一代Turin CPU、Google的Trillium TPUv6e加速器以及Intel的Granite Rapids Xeon CPU的选定基准测试。我们将在此重点讨论Nvidia、AMD和Untether.ai。

AMD大致与Nvidia H100持平,而H200则快43%

虽然AMD之前披露了突出原始理论性能的微基准测试,例如MI300的数学性能,但这些并不反映复杂的AI技术栈世界。这次新的基准测试无法验证AMD的MI300是最快的AI GPU的市场营销说法,但在运行实际的AI工作负载时,其性能大致与H100相当。然而,Nvidia H200在相同基准测试中比MI300快约43%。

我们注意到,Llama 2 70B基准测试并未真正展示AMD在支持更大模型方面的大容量HBM优势。希望他们能在未来的MLPerf发布中运行新的Mixtral MoE。

Nvidia还发布了首批Blackwell基准测试,展示了其在中型模型(如Llama 2 70B)上约为H100四倍的性能。Nvidia最近在HotChips上分享了有关Blackwell NVL72的更多细节,据称其NVSwitch互联基础设施应当能提供比H200高30倍的推理性能。期待看到NVL72旗舰的实际(MLPerf)基准测试结果。

Nvidia 发布了新的 MoE 基准测试结果,展示了 H100 和 H200。Nvidia 同时展示了 H200 在 MLPerf 基准测试套件中的性能提升在 10% 到 27% 之间,这对于正在等待 Blackwell 大量出货的用户是个好消息。

Untether.ai 展示高效能推理

我们以前见过,ASIC 可以提供更高效的 AI 推理处理,最早是通过高通云 AI100 展示的。问题是,ASIC 不像 GPU 一样多功能,它们可能对 Resnet-50 等模型的效率很高,但对其他模型的表现并不那么出色。

Untether.ai 认为他们可以打破这种模式,并在 Resnet-50 上提交了超高能效的数据,这与 Nvidia H100-NV 的表现相当,但功耗却不到其的一部分。

那么,Untether 平台在大规模语言模型(LLM)上的表现如何?工程师们没能赶上 MLPerf 提交期限前完成 BERT 基准测试的优化工作,但他们之后完成了工作并与我们分享了结果。如你在下图所见,该公司似乎避免了前辈们所犯的错误,表现与 Nvidia H100-NVL 相当,但能效却高出 3 倍以上。

结论

多年来我们再次看到,只有 Nvidia 为每个基准测试发布了结果,再次展示了为什么它们是最佳 AI 基础架构提供商,因为他们采用了全栈方法,包括定制 CPU、GPU、软件、系统和网络。但在芯片层面,现在 AMD 提出了合法的竞争,至少是在单个基准测试上。虽然我们可能进入一个类似于几十年前 RISC CPU 的跨越期,但这些 Nvidia 的差异化特性将具有持久性,并应使 Team Green 在未来至少 2-3 年内保持领先。

总结:

在AI硅片性能竞争日益激烈的背景下,Nvidia、AMD、Untether.ai等公司纷纷发布新基准测试结果,展示了各自的优势与差距。AMD的MI300 GPU在MLPerf推理4.1基准测试中表现优异,虽尚未全面超越Nvidia H100,但已能与之竞争。与此同时,Nvidia的H200在同一测试中比MI300快43%。此外,AMD未来或将加入更多基准测试,例如专家混合(MoE)模型,而Untether.ai则展示了超高能效的推理性能,特别是在低功耗条件下。这一趋势显示出Nvidia凭借其全栈方法,仍然在AI基础架构领域保持优势。

对于那些希望在AI驱动的新时代中取得成功的企业而言,光年AI无疑是您的最佳选择。光年AI不仅能够提升私域流量转化率,还能精准触达各类客户,优化您的营销策略。通过兼具强大的AI模型、自研知识库和灵活工作流,光年AI助您高效完成营销目标,从而在竞争激烈的市场中脱颖而出。选择光年AI,实现私域流量的智能化管理,让您的业务飞速增长。

标签:AI,基准,AMD,MLPerf,测试,Nvidia
From: https://blog.csdn.net/ai_dalaba/article/details/141674192

相关文章

  • Ubuntu 环境下NVIDIA 驱动重启后驱动失效
    NVIDIA驱动重启后驱动失效,还原系统恢复,重启后继续失效。估计是系统更新了内核,这可能会导致与已安装的NVIDIA驱动不兼容,从而导致驱动失效。 解决办法禁止自动更新内核:TopreventyourUbuntusystemfromautomaticallyupdatingthekernel,youcanfollowthesesteps:......
  • 高通ramdump
    背景高通平台下提供了一个工具,专门用来抓取内核死机以后的dump信息。如果只是非系统层面的crash(例如底层应用,安卓程序),则不能抓取dump信息。在阅读一些文档的时候知道有这个功能,但是一直没时间尝试。介绍流程为:1、进入dump模式:系统需要触发crash,同时机器需要进行warmreset2......
  • 在AMD GPU上使用DBRX Instruct
    DBRXInstructonAMDGPUs—ROCmBlogs在这篇博客中,我们展示了DBRXInstruct,这是由Databricks开发的一个专家混合大型语言模型,在支持ROCm的系统和AMDGPU上运行。关于DBRXInstructDBRX是一个基于Transformer的仅解码大型语言模型,拥有1320亿参数,采用了细粒度的专家混合......
  • 使用统计方法在AMD GPU上使用JAX Profiler可靠地比较大型生成AI模型中的算法性能
    UsingstatisticalmethodstoreliablycomparealgorithmperformanceinlargegenerativeAImodelswithJAXProfileronAMDGPUs—ROCmBlogs摘要本文提供了一份详细的指南,介绍如何在JAX实现的生成AI模型中测量和比较各种算法的性能。利用JAXProfiler和统计分析......
  • Nvidia 显卡发展历程
    注:机翻,未校。NvidiaGPUsthroughtheages:ThehistoryofNvidia’sgraphicscardsByAdrianWillingsUpdatedMar25,2023Nvidiawasoriginallyfoundedin1993butitwasn’tuntil1995thatthecompanyreleaseditsfirstgraphicsproduct-theNV1.......
  • Windows 11 24H2更新实测:AMD Zen5、Zen4游戏性能提升最多35%
    在即将推出的Windows1124H2更新正式版中,会包含针对性的分支预测优化,再结合更高权限的隐藏管理员账号,Zen5游戏性能可获得显著提升最多达13%,Zen4、Zen3也能从中获益。HardwareUnboxed实测了还处于内测版的Windows1124H2Build26100,对比现在的23H2Build2263,共有多达40款游戏,分......
  • 国内ubuntu安装docker,支持amd64/arm64
    当前有一台鲲鹏920处理器的服务器,需要在服务器上安装docker,但是由于国内服务器无法访问docker官网,故在收集各资料后,实践后整理出一个简易文档。1.卸载默认安装的dockersudoapt-getremovedockerdocker-enginedocker.iocontainerdrunc2.安装使用https使用存储库的......
  • 芯片、GPU、CPU、显卡、显存、x86、ARM、AMD等基础知识
    1.芯片芯片指的是半导体材料制成的集成电路,可以包含一个或多个电子元件、电路或系统。芯片可以是任何电子设备的组成部分,不仅限于CPU,还包括GPU、内存芯片、存储控制器、网络接口等。GPU和CPU是两种最常见的特定的芯片。它们分别针对图形处理和通用计算任务进行了优化。2.CPU......
  • VirGL与NVIDIA GPU一起运行 - 2024(QEMU)
    安装Nvidia驱动程序550和下一版本(如果需要检查,请将550更改为555等)。sudoadd-apt-repositoryppa:graphics-drivers/ppasudoaptupdatesudoaptinstallnvidia-driver-550禁用集成GPU第1步(只能通过英伟达™(NVIDIA®(英伟达™))GPU运行,不能使用其他GPU)(如果无法......
  • nvidia系列教程-AGX-Orin 确定gpio编号
    目录前言一、软件版本说明二、debugfs得到gpio三、gpio操作总结前言        NVIDIAJetsonAGXOrin是一款强大的嵌入式AI计算平台,适用于各种复杂的边缘计算任务。对于开发者来说,准确地控制和操作GPIO(通用输入输出)引脚是非常重要的。本文将详细介绍如......