首页 > 其他分享 >GPU池化技术保障智慧电网高效建设

GPU池化技术保障智慧电网高效建设

时间:2024-09-06 14:24:01浏览次数:10  
标签:高效 人工智能 电网 池化 GPU OrionX 算力

建设《新型电力系统》是能源互联网双碳目标下现阶段发展的核心发展形态。绿色、智能、互联已成为电力行业主旋律。人工智能是新一代电网和能源互联网的必然选择,电力人工智能将与未来新一代数据驱动的能源互联网和谐共生。当前国家电网已在电网安全与控制、输变电、配用电、新能源并网、企业经营管理等电网各个业务场景完成人工智能技术应用布局,建成一批成熟可靠的人工智能应用,形成多业务场景交叉融合的人工智能应用产业链。

01 智慧电网带来的信息化挑战

数据、算力、算法、是以《深度学习》为代表人工智能技术构建的核心三要素。伴随着“三型两网”战略规划落地,以 CPU + GPU 异构芯片、统一计算为代表的算力需求,在电力行业快速增长,同时带来如下信息化挑战:

  • 资源利用率低。据统计,数据中心整体 GPU 使用率平均在 10% ~ 30% 之间,大量资源因独占而被浪费。
  • 成本高昂。GPU采购成本昂贵,占服务器成本50%以上,甚至一卡难求。如何平衡人效和成本成难题。
  • 无法统一调配。服务器被分配在不同的业务线、项目组,且以卡为单位调度,缺少池化层,无法灵活、统一地调配异构算力资源。
  • 芯片厂商依赖。目前数据中心人工智能算力的硬件仍以GPU为主,逐步实现技术自主可控,建立良好生态、保护投资收益,成为大型集团客户信息化战略的考虑方向。
  • 计算资源配比不均衡。不同业务模型对 CPU 与 GPU 的算力需求不同,会导致对CPU 与 GPU 的配比失衡,难以突破单机限制。
  • 需求挑战巨大。人工智能业务已深入电网从生产到配电、终端客服的各业务板块,人工智能业务增长迅速,如部分省电网公司日增AI调用可达百万级别,算力需求挑战巨大。

02 建设适用电网的异构算力资源池

为提升算力配给效率、节约社会资源,某省国网公司与趋动科技共同联手建设落地了《大规模异构算力池化调度》项目,有效保障了国网人工智能业务的算力调度供给,缓解算力资源压力,同时为未来国产化异构算力建设提供了前沿研究。

该国网“人工智能业务平台”底层采用开源 K8S 容器编排平台,结合趋动科技OrionX AI算力资源池软件,底层在功能模块进行深度整合集成,在平台层通过调用OrionX API实现OrionX vGPU资源的申请调度,OrionX vGPU按照算力1% 、显存1MB任意组合,从而实现GPU资源池化能力。与自建人工智能平台打通,二者紧密结合,构建统一的算力池调度平台。

GPU池化技术保障智慧电网高效建设_人工智能

OrionX赋能智能电网建设

03 解决方案收益

  • 降本增效。池化后,OrionX软件定义GPU算力能力,使多业务可以共享一块物理GPU,单物理GPU利用率提升300%-400%, 在不增购硬件情况下,有效缓解算力紧张。
  • 简化运维。池化后,实现国网人工智能算力资源服务快速“一站式”集成。将人工智能计算任务,算力需求进行沉淀、集中和自动化,提升了AI算力全局管理能力,管理精细度,降低人工智能平台服务管理难度。
  • 异构算力池化管理。支持国产芯片的异构管理,业务运行时可选择底层硬件类型,为国产算力的技术生态做前瞻性技术储备。
  • 优化配比。OrionX提供GPU资源实时、更多维度和细粒度的监控,及调度策略,减少资源分配不均现象。同时借助池化的跨机调用能力,能有效解决异构计算配比难题,大大提升管理能力。
  • 节能减排。以软件方式提升单GPU卡的使用效率,减少设备采购,节约设备空间和能源消耗,助力双碳减排。

趋动科技结合国网现有人工智能平台,实现了人工智能算力资源服务快速“一站式”集成,将人工智能计算任务和算力需求进行沉淀、集中和自动化,提升AI算力全局管理能力及管理精细度,助力客户充分发挥出电力企业级规模优势,全面提升其智能化程度、速度,保障智慧电网建设!

标签:高效,人工智能,电网,池化,GPU,OrionX,算力
From: https://blog.51cto.com/u_16958038/11937767

相关文章

  • GPU池化赋能智能制造
    2023年3月10日,“第六届智能工厂高峰论坛”在杭州隆重揭幕。本次会议由e-works数字化企业网、浙江制信科技有限公司主办,中国人工智能学会智能制造专业委员会、长三角新能源汽车产业链联盟、长三角(杭州)制造业数字化能力中心、浙江省智能工厂操作系统技术创新中心协办。趋动科技作为......
  • 揭秘如何通过淘宝API接口高效获取商品数据
    在电子商务的世界里,数据就是力量。对于淘宝卖家来说,掌握店铺商品的全面数据是优化运营策略、提升销售业绩的关键。淘宝API,作为连接淘宝平台与外部应用的桥梁,提供了一键获取店铺所有商品的魔法钥匙。本文将带您踏上一场探秘之旅,揭秘如何利用淘宝API高效获取商品数据。一、淘宝API......
  • 工业制造企业如何与供应商间 进行高效安全的企业间文件传输?
    工业制造企业的供应商数量通常较多,这主要是由于工业制造行业的复杂性和多元化特点所决定的。工业制造企业的产品结构往往较为复杂,涉及到多种原材料、零部件和设备。这些物资的需求不仅数量大,而且种类繁多,因此需要与多个供应商建立合作关系,以满足不同产品的生产需求。同时,多个供应......
  • 《深入理解 C++中的右值引用:开启高效编程新篇章》
    在C++的编程世界中,右值引用是一个强大而又富有特色的特性,它为程序员提供了更高效的资源管理方式和更灵活的编程手段。本文将带你深入探讨C++中的右值引用,揭示其独特的特点和强大的功能。一、标题背后的意义C++中的右值引用究竟有何特殊之处?为何它成为了C++编程中的热点......
  • 通过三元运算符让 Python 代码更简洁高效
    目录什么是三元运算符?三元运算符的基本用法三元运算符的实际应用场景深入理解:三元运算符与普通`if-else`的比较三元运算符的注意事项三元运算符在实际项目中的应用总结在编程中,代码的可读性和效率是两个至关重要的因素。而Python,作为一种以简洁和易读著称的编......
  • Falcon Mamba: 首个高效的无注意力机制 7B 模型
    FalconMamba是由阿布扎比的TechnologyInnovationInstitute(TII)开发并基于TIIFalconMamba7BLicense1.0的开放获取模型。该模型是开放获取的,所以任何人都可以在HuggingFace生态系统中这里使用它进行研究或应用。在这篇博客中,我们将深入模型的设计决策、探究模......
  • GPU算力租用平台推荐
    国内知名云计算平台14:阿里云:国内领先的云计算服务提供商,GPU算力租用服务通过ECS(ElasticComputeService)实例提供。提供多种GPU实例类型,如NVIDIATeslaV100、P100等,适用于AI训练、视频编解码等应用。优势在于中国市场领先,在中国本地有广泛的用户基础和完善的服务......
  • 构建高效医护人员排班系统:Spring Boot框架的优势
    1系统概述1.1研究背景随着计算机技术的发展以及计算机网络的逐渐普及,互联网成为人们查找信息的重要场所,二十一世纪是信息的时代,所以信息的管理显得特别重要。因此,使用计算机来管理医护人员排班系统的相关信息成为必然。开发合适的医护人员排班系统,可以方便管理人员对医护......
  • 视频监控系统布局策略:EasyCVR视频汇聚平台构建高效、全面的安全防线
    随着科技的飞速发展,视频监控系统已成为现代社会安全防范的重要组成部分,广泛应用于公共场所、企业园区、住宅小区等各个领域。一个科学合理的视频监控系统布局与选型策略,不仅能够显著提升安全监控的效率和效果,还能在关键时刻提供关键证据,保障人员与财产的安全。一、需求分析:明确监......
  • 高效管理校园资产的智慧校园资产借用归还系统
    智慧校园资产管理系统中的资产借用归还功能是为了更好地管理学校内部的各种设备和物资,确保其能够高效、有序地流通与使用。这一功能模块的设计初衷在于解决传统资产管理中存在的问题,如资产去向不明、借用记录不清晰、归还不及时等问题,通过信息化手段提升资产管理效率。在系统中,用户......