首页 > 其他分享 >全国首个!天翼云上海临港国产单池万卡液冷算力集群启用!

全国首个!天翼云上海临港国产单池万卡液冷算力集群启用!

时间:2024-04-09 10:30:58浏览次数:27  
标签:液冷 天翼云 集群 万卡 智算 算力

3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,八家合作伙伴宣布将作为首批用户入驻临港国产算力池。这是国内首个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体公共智算中心。通过中国电信天翼云打造的人工智能公共算力服务平台,将以公共普惠、创新领先的算力供给,算、存、运一体的综合算力服务模式,全面赋能上海千行百业,成为上海“新算力”的重要一极。

作为数字中国建设主力军、云服务国家队,中国电信天翼云积极落实国家政策要求,深耕算力基础设施建设,于今年年初在上海临港智算园区投建15000卡公共智能算力中心,这是全国规模最大的运营商级智算中心,将助推上海抢占全国算力发展制高点。经过紧张的建设,3月22日,上海临港智算园区的首个国产单池万卡液冷算力集群正式交付,并投入商业运营。此次启用的天翼云上海临港国产单池万卡液冷算力集群创新性地采用网络中置、算力分层的“魔方”型,实现了单一集群内万卡高速互联,满足万亿级参数大模型训练所需的多机多卡并行、高吞吐无损通信等需求。同时,为了实现绿色低碳的目标,全面采用融合液冷服务和IDC基础设施的新一代智算液冷DC舱,实现了数据中心的能效和智算集群的算效双提升,为“人工智能+”提供智能、弹性的绿色算力

目前我国人工智能产业正处于高速发展阶段,此次正式运营的公共智算中心,以中国电信天翼云自研TeleCloudOS4.0为底座,承载天翼云算力分发网络平台“息壤”、智算基础设施平台“云骁”、一站式智算服务平台“慧聚”,构建算力聚合分发的新模式,实现全栈能力自主可控、安全可信,多项技术指标领先,可为大模型企业提供从算力供给、算力输送、算力调度到模型训练及推理应用的一站式服务。“慧聚”可针对大模型训练微调场景,提供训推一体化算力服务,实现万卡资源调度;“云骁”支持多款国产芯片以及上层框架,可以对万卡规模智算集群进行纳管,算力、存储、网络多层次算力加速,全方位监控、故障自动感知,实现超大规模集群长稳运行;“息壤”算力网络盘活上海区域零散的通算、智算和超算算力,目前已纳管多个算力厂商,为企业提供普惠的智算调度服务。

作为引领新一轮科技革命和产业变革的战略性技术和重要驱动力量,人工智能产业机遇正在加速涌现,算力服务对于推动产业转型升级的赋能作用日趋显著。天翼云将持续坚持科技创新,不断夯实国云智算底座,推动人工智能技术成果转化,为数字经济发展蓄能添力,助推数字中国建设。

标签:液冷,天翼云,集群,万卡,智算,算力
From: https://blog.csdn.net/m0_67255065/article/details/137510304

相关文章

  • 免费试用!英智未来BayStone平台提供高性能算力服务
    英智未来BayStone人工智能公共服务平台聚焦全球高端算力资源,提供基于英伟达HGX1系列GPU算力服务,现面向所有政企和科研机构提供现货算力资源服务。点击申请试用   BayStone平台通过全球算力资源调度,帮助用户高效使用高端算力资源,为各类计算任务提供强大的......
  • 全国首/个!天翼云上海临港国产单池万卡液冷算力集群启用!
    3月22日,中国电信宣布,天翼云上海临港国产万卡算力池正式启用,八家合作伙伴宣布将作为首批用户入驻临港国产算力池。这是国内首/个投入正式运营的国产单池万卡液冷算力集群,也是业内领先的全国产化云智一体公共智算中心。通过中国电信天翼云打造的人工智能公共算力服务平台,将以公共普......
  • 第一!天翼云领跑中国边缘云laaS市场!
    近日,弗若斯特沙利文(Frost&Sullivan,简称“沙利文”)联合头豹研究院发布《2023年中国边缘云市场报告》,天翼云在2023H1中国边缘云IaaS层细分市场位列第一,领跑中国边缘云市场。近年来,随着5G、物联网等技术的飞速发展,智能终端设备数量迅速增加,产生的数据量呈指数级增长,这对数据处......
  • 上海天翼云代理商:分布式消息服务Kafka高吞吐、高可用的消息中间件服务
    上海天翼云代理商:分布式消息服务Kafka高吞吐、高可用的消息中间件服务简介:飞机@luotuoemo本文由(天翼云代理商:【金推云】www.jintui.cn)撰写天翼云:领航分布式消息服务的行业先锋在当前的大数据时代,如何有效地处理和管理海量数据已成为企业的关键挑战之一。这里,我们要引入一......
  • 天翼云充值:分布式消息服务RabbitMQ支持AMQP协议,兼容RabbitMQ生态
    天翼云充值:分布式消息服务RabbitMQ支持AMQP协议,兼容RabbitMQ生态简介:飞机@luotuoemo本文由(天翼云代理商:【金推云】www.jintui.cn)撰写天翼云:支持AMQP协议的RabbitMQ服务分布式消息服务RabbitMQ是一种开源的、基于Erlang语言的消息代理和队列服务器。RabbitMQ最大的特性就......
  • 重庆天翼云代理商:分布式容器云平台面向多云、多集群等场景推出的企业级容器云平台
    重庆天翼云代理商:分布式容器云平台面向多云、多集群等场景推出的企业级容器云平台简介:飞机@luotuoemo本文由(天翼云代理商:【金推云】www.jintui.cn)撰写重庆天翼云代理商:分布式容器云平台在当今的信息化社会,一种名为“云计算”的技术正在逐渐改变我们生活和工作的方式。云......
  • 北京天翼云代理商:分布式消息服务MQTT面向终端设备的轻量级消息产品
    北京天翼云代理商:分布式消息服务MQTT面向终端设备的轻量级消息产品简介:飞机@luotuoemo本文由(天翼云代理商:【金推云】www.jintui.cn)撰写北京天翼云代理商:分布式消息服务MQTT面向终端设备的轻量级消息产品一、天翼云的优势天翼云是中国电信旗下的云计算和大数据服务品牌,依......
  • 玩转云端 | 网络也i人?咋变显眼包?天翼云AccessOne边缘接入来了!
    你是具有“社牛”属性的“e人”还是“社恐”属性的“i人”?在年轻群体中火起来的“MBTI人格测试”中“i”代表intraversion(内倾型)“e”则代表extraversion(外倾型)也就是大家平时所说的内向和外向在征服internet的道路上总有些痛是i人和e人都无法承受的……比如,网络连接比i......
  • 又双叒叕获奖!天翼云推动算力服务便捷普惠泛在!
    2023年6月30日,由中国信息通信研究院、中国通信标准化协会主办的“2023云边协同大会”在北京举办。大会聚集了产学研用各界大咖,深入探讨云边协同趋势及产业创新发展。大会颁发了多个奖项,天翼云分别斩获三项“分布式云技术创新先锋案例”奖,两项“2023年度分布式云最佳实践先锋案例”......
  • MegaScale:字节万卡集群
    随着训练集群扩展到超过数万个GPU,软件和硬件故障几乎不可避免。字节引入了一个健壮的训练框架,实现了自动故障识别和快速恢复,在最少的人为干预下实现了容错,并且对正在进行的训练任务的影响可以忽略不计。1.训练流程分配资源:在接收到提交的训练任务后,driver进程会与自定义的K......