浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

时间：2023-02-20 15:00:59浏览次数：54

近日，淮海智算中心携手浪潮信息进行了超大规模参数AI大模型训练性能测试，实测数据表明，千亿参数规模的自然语言AI单体大模型在淮海智算中心计算平台上的训练算力效率达53.5%，刷新了业内AI大模型训练算力效率新高。这意味着淮海智算中心将可为国内生成式AI创新团队提供高性能、高效率的AI大模型训练算力服务。

生成式AI需要基于海量的自然语言或多模态数据集，对拥有巨大参数的超大规模AI模型进行训练，其训练所需AI算力当量非常高，如以PD(Petaflops-Day)为单位来衡量，OpenAI的GPT-3大模型训练的算力当量为3640PD，而浪潮“源1.0”大模型的算力当量则为4095PD。

超大规模AI大模型的训练一般必须在拥有成百上千加速卡的AI服务器集群上进行，如何在AI计算集群上获得更高的训练算力效率则会直接影响到模型训练时长以及算力消耗成本，这对于提升生成式AI研发创新效率有着非常重要的影响。据公开资料表明，GPT-3大模型在其V100 GPU集群上的训练算力效率为21.3%，而浪潮“源1.0”的训练算力效率则达到了44.8%。

针对AI大模型训练的计算特点，浪潮信息AI团队对淮海智算中心算力系统进行了专业设计，对集群架构、高速互联、算力调度等方面进行全面优化，在系统架构上，采用单节点集成8颗加速器的AI服务器，节点内加速器间实现超高速P2P通信，节点间建立极低延迟、超高带宽的Infiniband通信网络。在大模型训练技术层面，成功运用了中文巨量AI模型“源1.0”的训练优化经验，对分布式训练策略进行了针对性优化，通过合理设计张量并行、流水并行和数据并行，精准调整模型结构和训练过程的超参数，最终实现了千亿参数规模AI大模型的训练算力效率达到53.5%。

浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%_数据

千亿参数AI模型结构及其实际性能表现

淮海智算中心由安徽省宿州市与浪潮共同推进建设，目标是建成技术先进、架构开放、应用丰富、生态完善的国内领先智算枢纽。淮海智算中心将依靠领先的算力、算法基础设施，开放的技术架构，成熟丰富的生态应用，面向全国提供智能算力、数据和算法服务，打造良好的智算产业生态。

标签：训练,AI,模型,50%,智算,算力,淮海
From： https://blog.51cto.com/u_15890566/6068581

家长减负科学伴学，作业帮AI学习桌梦想家到底有何魅力？
伴随科技的发展和新时代育儿方式的不断演变，越来越多的家长都意识到了智能学习工具的重要性。就拿目前市面比较火热的作业帮智能学习桌来说，其不仅能能让孩子矫正坐姿，预防近视......
Java面试宝典_君哥讲解笔记02 描述JDK、JRE、JVM之间的关系、如果main方法声明成priva
系列文章目录文章目录系列文章目录java基础面试题请描述JDK、JRE、JVM之间的关系如果main方法被声明成private会怎么样呢？&和&&区别在......
PHP对接chatGPT代码，openai接口对接，php 实现chatGPT功能
前面已经说过了如何对接chatGPT的接口，下面是PHP的代码版本<?phpdefine('OPENAI_API_KEY','你的APIKEY');$prompt=$_GET['prompt'];$response=sendPostRequest($......
00022.13 数据IO流：DataInputStream和DataOutputStream
系列文章目录文章目录系列文章目录一、DataInputStream是什么？二、DataOutputStream代码一、DataInputStream是什么？二、DataOutputStream代......
javaEE005.03 HTTP通信协议和报文、STS中tomcat目录分析、响应码 200、404、500、302
系列文章目录文章目录系列文章目录前言一、tomcat目录分析二、HTTP协议1、简介：简介一般就是什么ssHTTP2.发展历程3......
Unity Coroutine和async、await对比
此篇文章，不谈原理，只聊用法，对比着看更容易理解上述代码执行的逻辑顺序是一样的定义异步方法，协程用IEnumerator，线程用 async具体异步执行的内容，协程用yield，线程......
ASE50N03-ASEMI低压N沟道MOS管ASE50N03
编辑：llASE50N03-ASEMI低压N沟道MOS管ASE50N03型号：ASE50N03品牌：ASEMI封装：TO-252最大漏源电流：50A漏源击穿电压：30VRDS（ON）Max：5.8mΩ引脚数量：3沟道类型：N沟道MOS管芯片......
main执行之前和之后执行的代码可能是什么？
执行之前：主要用于初始化系统相关资源设置栈指针初始化静态变量和全局变量。.data段的内容没有初始化的全局变量赋初始值全局对象初始化将main函数的参数传递给main......
HDOJ1021 Fibonacci Again
题目链接：http://acm.hdu.edu.cn/showproblem.php?pid=1021这个题最坑的莫过于范围了，开始用long，测试了下，发现很快就超范围了。然后想着使用大数，考虑到时间的限制，再次......
50行代码完成微信小程序-跳一跳辅助工具，让你成为朋友圈最靓的仔
前言2017年12月28日，微信更新的6.6.1版本开放了小游戏，微信启动页面还重点推荐了小游戏「跳一跳」。不说废话直接上代码设置公共参数 doubleratio=1; //弹跳系数......

浪潮信息助力淮海智算中心，千亿参数AI大模型训练算力效率超50%

相关文章

赞助商

阅读排行