首页 > 其他分享 >关于ANSYS Fluent在曙光&宁畅&中科可控R6250A0 AMD平台服务器上的硬件性能优化建议

关于ANSYS Fluent在曙光&宁畅&中科可控R6250A0 AMD平台服务器上的硬件性能优化建议

时间:2024-09-16 09:56:37浏览次数:13  
标签:宁畅 BIOS R6250A0 AMD fluent bios 测试 Performance SG

一、问题描述

某客户反馈fluent双节点比友商节点慢,差距约17%左右,经工程师现场调优未达到优化目标。

1.1 软、硬件配置:

cpu:AMD 9554 3.1G 64C *2   

内存:16G*32 

bios固件版本:SDH2043010

系统:rhel8.9

Fluent工具版本:22.10

二、问题处理

Application Profile Configuration 改成High Performance Mode可以满足要求,fluent测试双节点测试比友商快5-8s,bios设置如下

bios设置

bios设置

       

但现场高性能计算场景和用户均要求关闭SMT,BIOS按场景设置为performance mode-此模式下无法单独关闭SMT,改成手动按场景设置依然无法到达效果。测试过程中发现CPU频率存在差距,友商设备稳定在3.75GHz左右,R6250A0仅在3.4-3.5GHz之间。需要持续调优

三、处理建议

持续对bios配置进行修改,具体修改内容如下:

BIOS配置项

SG

SG修改后

BIOS版本

SDH2043010

SDH2043010

SMT Mode

Enable

Disable

SVM Mode

Enable

Disable

Core Performance Boost

Enable

Enable

Global C-state Control

Disable

Disable

Power Profile Selection

High Performance Mode

High Performance Mode

Determinism Control

Auto

Manual

Determinism Enable

Performance

Power

TDP/PPT

Auto

400W

SR-IOV

Auto

Disable

在修改BIOS配置选项后,单机浮点计算运行正常,基本保持在7000到7100Gflops左右。

在基准测试测试一致后,对比用户应用测试结果。Fluent22.10测试结果如下:

厂商

SG(耗时)

友商(耗时)

差异

单机fluent

1240s

1201s

3%

双节点fluent测试

616s

561s

9%

修改tuned-adm配置后测试如下:

两节点

四节点

SG

友商

SG

友商

tuned  off

571s

561s

hpc-compute

560s

550s

290s

Throughput-performance

616s

565s

368s

最优测试结果SG:560s , 友商:550s,性能相差1.8%左右。

对于性能还有1.8%左右的差距持续排查发现:

①、kernel参数值有多处不一样;

②、系统rpm包数量不同;

③、BIOS配置不同。

上述综合因素导致可能存在一定差异,客户方面已能够接受,可进行交付。结合上述bios手动高性能调优以及tuned服务设置为hpc-compute,可能更适合fluent运行场景。对于存在的差异后续会反馈AMD持续分析。

标签:宁畅,BIOS,R6250A0,AMD,fluent,bios,测试,Performance,SG
From: https://blog.csdn.net/qq_27815483/article/details/141394289

相关文章

  • 专访AMD:AMD 正式加入龙蜥社区首秀:开源协作与 AI 创新的交汇点
    编者按:近日,2024龙蜥操作系统大会已于北京圆满举办。会上,龙蜥社区发布了“AnolisOS23生态衍生计划”、“CentOS替代计划”及“AI应用推广计划”三大计划,从产品、生态及应用维度为AI需求爆发主动布局,打造面向“云+AI”的下一代服务器操作系统。大会另一个重......
  • AMD EPYC(霄龙)系列100-000000506、100-000001287、100-000001289、100-000001285 AI处
    AMDEPYC(霄龙)7003系列处理器为主流数据中心服务器树立性能和能效新标杆。相对于前两代产品,新的AMDEPYC7003系列处理器通过改进的工艺实现了基础及Boost频率的提升,并通过架构革新实现了19%的IPC提升。同时,AMD也在IODie中集成了新的安全处理器(SecureProcessor);能够在不影响性能......
  • AMD 主板设置
    amd风扇转速设置100转,使用原厂风扇 工业科技精华啊~风扇转速模式调到能设置风扇那个开启冷又净才行温度阈值规则是低温30度 高温设置62度 显示器不亮有可能是插错口了英伟达+apu也开交火单开pci模式是独显模式驱动用驱动总裁把快捷键跟更新关了windows更新时间......
  • 1.9 Crash(三,Ramdump的分析)
    写在前面前面我们介绍了triggerfullsystemcrash的常见的五种类型。那么接下来我们来分析下,如何从解析Ramdump的产物中来分析为是哪一种类型,进而一步步找出问题的根因。无论是使用QCAP查看TZ_Counters.txt,还是使用qnx_host_ramdump_parser.py解析查看tz_diag.txt中RESETIN......
  • 《黑神话:悟空》游戏启动时崩溃弹窗“找不到amdvlk64.dll”该怎么办?黑神话悟空游戏闪退
    当《黑神话:悟空》启动时崩溃弹窗提示“找不到amdvlk64.dll”,可以考虑重新安装游戏以找回该文件。也可从可靠来源下载amdvlk64.dll,放置到游戏安装目录下,尝试解决问题让游戏正常启动。本篇将为大家带来《黑神话:悟空》游戏启动时崩溃弹窗“找不到amdvlk64.dll”该怎么办的内容,感兴......
  • AMD与英特尔终于迎来Copilot+的应用
    微软在2024年IFA展会上确认,其Copilot+功能将于今年晚些时候登陆搭载AMD和Intel处理器的笔记本电脑。在一篇博客文章中,微软透露,符合最低Copilot+要求的AMD和IntelPC将在11月通过免费的Windows11更新获得这些AI功能。这种AI功能的普及,也让我们更加期待光年AI在国内的应用效果。......
  • 标签贴错,AMD召回所有新一代CPU
    前言 上个月,AMD首席执行官苏姿丰博士在ComputeX开幕主题演讲上揭开了Zen5架构的神秘面纱。作为AMD未来几年CPU的台柱子,Zen5立刻被引入消费级市场,面向笔记本和台式机的产品在几周内相继发布。欢迎关注公众号CV技术指南,专注于计算机视觉的技术总结、最新技术跟踪、经......
  • AMD在新的MLPerf基准测试中缩小了与Nvidia的差距
    AMD、UntetherAI、Google、Intel和Nvidia的新基准测试结果显示,AI硅片性能竞争日趋激烈。然而,系统设计、网络和软件使AI大放异彩,而这正是Nvidia的强项。终于,我可以停止抱怨AMD缺乏公开的AI基准测试了。AMD发布了其MI300GPU的优秀MLPerf推理结果,虽然只在一个基准测试上与Nvidi......
  • 高通ramdump
    背景高通平台下提供了一个工具,专门用来抓取内核死机以后的dump信息。如果只是非系统层面的crash(例如底层应用,安卓程序),则不能抓取dump信息。在阅读一些文档的时候知道有这个功能,但是一直没时间尝试。介绍流程为:1、进入dump模式:系统需要触发crash,同时机器需要进行warmreset2......
  • 在AMD GPU上使用DBRX Instruct
    DBRXInstructonAMDGPUs—ROCmBlogs在这篇博客中,我们展示了DBRXInstruct,这是由Databricks开发的一个专家混合大型语言模型,在支持ROCm的系统和AMDGPU上运行。关于DBRXInstructDBRX是一个基于Transformer的仅解码大型语言模型,拥有1320亿参数,采用了细粒度的专家混合......