去年世界人工智能大会(WAIC 2022)上,只有屈指可数的几家大厂推出大模型,但在科技部新一代人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,我国10亿参数规模以上的大模型已发布79个,几乎进入“百模大战”。
而中国有一半左右的大模型创新,都是由昇腾AI来支持的,开发者数量从90万到180多万,原生孵化和适配30多个大模型,已发展1200多家ISV(独立软件开发商),联合推出2500多个行业AI解决方案。昇腾AI正是国内唯一一个完成千亿参数大模型训练并商用的系统。
此外,华为推出“昇腾伙伴网络”(简称APN)合作伙伴计划,将通过总经销商供货的销售支持、华为与总销售商双方的技术支持模式,思腾合力凭借多年在AI行业的积累和自身的实力成为首家签署APN合作协议的公司,共同打造基于昇腾的软硬件AI基础架构解决方案,推进人工智能国产算力替代的进步和发展。昇腾产品应用覆盖比较全面,产品型号也比较丰富,接下来我们就逐一介绍一下:
Atlas 300T pro
T代表training,训练卡,pro是升级版,其性能特点是:
1. 高度集成:AI算力、通用算力、I/O能力三合一,处理器集成30个华为达芬奇AI Core +16个TaiShan核 + 1 * 100GE RoCE v2网卡。
2. 超强算力:提供业界领先的280 TFLOPS FP16算力。
3. 高速带宽:支持PCIe 4.0和 1*100G RoCE高速接口,出口总带宽56.5 Gb/s;无需外置网卡,训练数据和梯度同步效率提升10%~70%。
4. 32GB HBM内存支持ECC,专为训练设计,训练一个好的模型,需要使用大量数据,内存带宽要够大,内存容量要足够大,相比传统的DDR4内存,HBM内存的带宽可以提高10倍以上,功耗也更低。
Atlas 300V pro
V代表Video,视频解析卡,pro是升级版,其性能特点是:
1. 内置DVPP预处理单元,它是昇腾AI处理器内置的图像处理单元,提供强大的媒体处理硬加速能力,主要功能包括缩放、抠图、色域转换、图片编解码、视频编解码等。具有超大视频解析路数、高性能特征检索、安全启动等优势,支持128路高清视频实时分析。
2. 48G LPDDR4X 内存容量,LPDDR4X的特点是低功耗、高带宽、高频率,专为视频解析这种高带宽、多路数、视频解析流畅度高的应用场景而设计。
3. 强大的视频编解码能力可广泛应用于智慧城市、智慧交通、智慧园区、智慧金融、智慧制造等诸多AI行业场景。
Atlas 300I Pro
I代表 Inference, 推理卡,Pro升级款,基于昇腾310 芯片开发最高功耗72W,被动散热,半高半长单宽,达芬奇架构。性能特点:
1.拥有超强算力:单卡最大提供140 TOPS INT8算力,为数据中心推理提供更强大支持。
2. 超高能效:提供 2 TOPS/W 超高能效比,达到业界2.1倍。
3. 算力与显存平衡,搭载24G LPDDR4X内存,且支持ECC,保证推理的及时性。
4. 强大的AI 推理性能,可用于:内容审核、搜索推荐、票据识别、信息录入、资料对比、身份证实名认证、电子签名识别、语音识别等应用场景。