首页 > 其他分享 >阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享

时间:2023-09-28 16:02:13浏览次数:33  
标签:原生 云易立 模型 易立 AI 开源 阿里 KubeCon 以云

今天,由云原生计算基金会 CNCF 主办的 KubeCon+CloudNativeCon+OpenSourceSummit China 2023 主论坛在上海举办。阿里云容器服务负责人易立在主论坛发表演讲,介绍阿里云为大模型提供的基础设施能力,以及通过云原生 AI 的方式助力大模型普惠提效。

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_阿里云

易立在主论坛现场演讲

大模型无疑是 AI 领域最重要的进展之一,生成式 AI 的惊艳表现让关于下一代人工智能“魔力”的讨论进入街头巷尾,也让云计算的行业价值和技术核心迎来再次升级。易立认为, “规模”、“性能”和 “效率” 正在成为影响大模型生产和应用的三个核心因素,也是企业基础设施在面临生产、使用大模型时的全新挑战。“为了应对这些挑战,我们需要算法突破,也需要工程创新”,易立表示。

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_KubeCon_02

而解决规模、性能、效率的问题,需要与社区共同探索与突破。多年来,阿里云积极参与云原生社区生态建设,推动云原生 AI 应用更高效地运行在 Kubernetes 上,包括向 CNCF 捐献云原生数据集编排与加速项目 Fluid,以及 AI 工作负载管理框架 KubeDL 等;推动 Kubernetes Scheduler Framework 以更原生的方式支持 AI 工作负载。例如,OpenAI 在其大规模训练集群中使用了阿里云开源贡献的 Coscheduling 调度插件,大幅优化了资源分配效率。

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_大数据_03

易立介绍,“在支持企业大模型AI创新过程中我们发现,如何有效地管理 AI、大数据任务及其对异构算力资源的调度,是当前面临的新挑战。”

为了让企业以统一的方式支持微服务、大数据、AI 应用等多样化工作负载,阿里云开源了云原生调度系统 Koordinator。它是基于阿里巴巴大规模调度实践孵化出的开源 Kubernetes 调度器实现。在开源近1年半的时间里,Koordinator 已被小红书、小米、360、爱奇艺等多家企业应用于生产环境。“我们正在推进 Koordinator 捐赠到 CNCF 基金会,保持项目长期健康地发展。”易立介绍。

除了调度优化方面的工作,阿里云容器服务 ACK 和云原生 AI 套件构建了包含 GPU/NPU 高效运维、AI 作业管理、数据集访问加速、弹性训练与推理等完整的AI基础设施能力,在此之上既支撑了阿里云 PAI、灵骏智算、通义千问、妙鸭等 AI 平台与服务,也支持了多种开源 AI 框架和大模型方案。 这些产品化的技术能力已被广泛应用于任意门、小米、Recruit 等海内外企业,帮助客户快速构建自己的 AI 系统,显著提升 GPU 资源效率和 AI 工程效率。

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_基础设施_04

此外,如何有效运用大模型,将 AIGC 技术在各行业落地,成为行业关注焦点。发展开源生态是降低大模型应用使用门槛、推动人工智能技术普惠的必由之路。

阿里云是开源的受益者,也是积极贡献者,此前阿里云公布全新的 1+4 开源战略,持续投入 AI、云原生、数据库、大数据、操作系统等领域的开源工作,持续提升开发者服务和企业创新支持,为开源创新提速。 易立表示:“开源社区就像一个神经网络,我们每个人都是其中一个神经元,紧密相连、互相协作。只有不断地连接、贡献、反馈,开源生态才能释放出无限的潜能与创新。”

当前,阿里云已经形成了基础设施即服务(IaaS)、平台即服务(PaaS)和模型即服务(MaaS)三层架构,可为企业提供从大模型训练到推理、服务的端到端解决方案。以模型为中心的开发范式已成为新趋势,而云计算是 AI 普及和普惠的最好选择。未来基于云计算技术,以基础大模型为底座,将会推动全行业智能化升级。

现场精彩速递 DAY2

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_阿里云_05

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_基础设施_06

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_基础设施_07

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_KubeCon_08

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_KubeCon_09

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_阿里云_10

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_阿里云_11

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_基础设施_12

阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享_KubeCon_13

标签:原生,云易立,模型,易立,AI,开源,阿里,KubeCon,以云
From: https://blog.51cto.com/u_13778063/7640262

相关文章

  • 阿里云易立:以云原生之力,实现大模型时代基础设施能力跃升 | KubeCon 主论坛分享
    今天,由云原生计算基金会CNCF主办的KubeCon+CloudNativeCon+OpenSourceSummitChina2023主论坛在上海举办。阿里云容器服务负责人易立在主论坛发表演讲,介绍阿里云为大模型提供的基础设施能力,以及通过云原生AI的方式助力大模型普惠提效。易立在主论坛现场演讲大模型无疑是......
  • 龙蜥社区与您相约 2023 KubeCon
    作为云原生领域最负盛名的技术大会之一,KubeCon+CloudNativeCon+OpenSourceSummitChina2023吸引全球顶尖的云原生专家们汇聚其中。2023年9月26-28日,将于上海跨国采购会展中心展示最前沿的技术创新,上百位嘉宾带来上百场主题演讲,为所有与会者提供了交流、学习和探索"......
  • 龙蜥社区与您相约 2023 KubeCon
    作为云原生领域最负盛名的技术大会之一,KubeCon+CloudNativeCon+OpenSourceSummitChina2023吸引全球顶尖的云原生专家们汇聚其中。2023年9月26-28日,将于上海跨国采购会展中心展示最前沿的技术创新,上百位嘉宾带来上百场主题演讲,为所有与会者提供了交流、学习和探索"......
  • 你眼中的程序员 vs 程序员眼中的自己,是时候打破刻板印象了丨KubeCon 主题活动
    有人说,程序员工作赚钱真简单,电脑上按按键盘就行了,一点也不辛苦。有人说,程序员不懂生活,就知道天天对着电脑。“在长辈眼里,程序员是坐办公室的神秘职业、高级白领;在朋友邻居眼里,程序员是修电脑高手;在异性眼里,程序员是不修边幅的宅男,但是程序员的梦想大部分都是改变世界。”如果我们打......
  • 你眼中的程序员 vs 程序员眼中的自己,是时候打破刻板印象了丨KubeCon 主题活动
    有人说,程序员工作赚钱真简单,电脑上按按键盘就行了,一点也不辛苦。有人说,程序员不懂生活,就知道天天对着电脑。“在长辈眼里,程序员是坐办公室的神秘职业、高级白领;在朋友邻居眼里,程序员是修电脑高手;在异性眼里,程序员是不修边幅的宅男,但是程序员的梦想大部分都是改变世界。”如果我......
  • 创建用户[devuser]认证授权的 kubeconfig 文件
    当我们安装好集群后,如果想要把kubectl命令交给用户使用,就不得不对用户的身份进行认证和对其权限做出限制。下面以创建一个devuser用户并将其绑定到dev和test两个namespace为例说明。创建CA证书和秘钥创建devuser-csr.json文件{"CN":"devuser","key":{......
  • 华为重磅亮相 KubeCon China 2023,与你共启大模型时代的云原生!
    ......
  • springboot vue电子班牌系统源码,以云平台、云服务器为基础,融合课程管理、物联控制、
    随着时代进步,数字信息化不断发展,很多学校都开始了数字化的转变。智慧校园电子班牌系统是电子班牌集合信息化技术、物联网、智能化,电子班牌以云平台、云服务器为基础,融合了班级文化展示、课程管理、物联控制、教务管理、考勤管理、素质评价、资源管理、家校互联等一系列应用。实现了......
  • kubectl之kubeconfig配置
     一、介绍我们一般使用kubectl去操作K8S集群,如部署Pod,获取node信息,获取pod信息,获取svc信息,删除某个svc等。kubectl默认会从$HOME/.kube目录下查找文件名为 config 的文件,也能通过设置环境变量 KUBECONFIG 或者通过设置去指定其它kubeconfig文件。kubeconfig就是为访问集群所......
  • AWS配置一个工具可以连接的kubeconfig
    问题:因为eks的kubeconfig是动态生成User和IAM绑定的,所以工具无法直接连解决方案:终端创建# 创建一个命名空间kubectlcreatensvela-system# 创建一个sa账号kubectlcreatesakubevela-vela-core-nvela-system# 把sa账号(kubevela-vela-core)与cluster-admin这个具有管理员权限......