首页 > 其他分享 >磐舟磐基平台:基于KubeEdge的落地实践

磐舟磐基平台:基于KubeEdge的落地实践

时间:2023-06-26 11:31:42浏览次数:45  
标签:PaaS KubeEdge 落地 运维 磐舟 集群 节点

摘要:实现统一管理、简化多集群的运维系统、减少运营成本;同时也成功将前面提到的500台鲲鹏服务器以及它上面的BC Linux for Euler集群纳入磐基PaaS平台的大家庭之中,运维效率大幅增加。

本文分享自华为云社区《中国移动:磐舟磐基平台 基于KubeEdge的落地实践》,作者:中国移动磐舟磐基团队 & 华为iSula团队 & CNCF KubeEdge团队。

磐舟一体化云交付平台是中国移动自主研发的面向开发人员的代码开发,自动部署的平台。磐舟一体化交付平台自研实现了一套GitOps驱动引擎,支持从需求设计、开发构建、测试部署的全部开发与运维功能需求,实现应用一键上磐基容器云平台。

磐基容器云平台是中国移动信息公司基于Kubernetes构建的企业级PaaS解决方案,实现Kubernetes能力的标准化封装及调用,包括提供开发和运行环境、资源弹性伸缩、精细化微服务管理、便捷一站式服务、跨地域多集群调度和智能监控维护等六大能力。

磐舟磐基平台:基于KubeEdge的落地实践_鲲鹏服务器

磐舟磐基平台:基于KubeEdge的落地实践_磐舟磐基平台_02

磐舟和磐基是相互配合的,开发人员在磐舟集群上开发,部署到磐基PaaS集群上运行应用,也支持在磐舟上归档磐基集群ops配置,通过GitOps来管理、部署磐基集群。

随着国产化进程推进,中国移动建设了大量的国产化服务器集群,磐基磐舟如何实现国产化的容器云开发交付一体化体系?在某资源池我们需要统一管理近500台鲲鹏服务器,源码可以通过磐舟统一编译为X86/ARM双架构的镜像,但是集群的管理也需要实现ARM自动化支持,开发交付环节频繁使用Kubernetes集群,最近2个月已有800多次的集群创建回收动作,人工支撑显然已经跟不上云原生的发展速度了。

另一个场景是,移动的开发人员在集团磐舟Kubernetes集群上进行开发,制作好镜像后,不能直接推送到省测公司的Kubernetes集群,需要运维人员在磐基中心集群上通过多级ssh跳板机,手工登录到省公司磐基K8s集群进行部署。这一步没有实现自动化,操作流程十分繁琐。

磐舟磐基平台:基于KubeEdge的落地实践_Kubernetes_03

想解决这些问题,我们进行了一些尝试:

首先是考虑是否可以将集群统一?答案显然是不行。因为集团k8s集群,由于业务不同,不能和省公司的k8s集群合为一体。

那么是否可以做k8s的集群联邦?目前集团集群与省公司集群之间可能是比较远的(跨省),集群联邦的整体消耗会大一些,并且目前跳板机的场景,跳到省公司集群一台机器上就够了,不需要看到省公司的所有机器。

维持ssh现状,维护shell脚本?shell脚本需要人力维护,在省公司的节点逻辑很可能需要使用service来完整,继续维护shell,第一不是那么CloudNative,第二也背离了磐基磐舟轻松上云的初衷。

本着达到灵活、易用,提升集群部署时效,解决端到端开发运维效率,成就内部客户的目的,我们针对整体场景做了进一步抽象,抽象成“1+31+N”的典型网络模型。

1个中心+“31+N”个边缘集群的场景,中心与集群、集群与集群,集群与N之间,存在着网络隔离与网络不可预知的情况;在这些集群之间,保持网络隔离的情况下,在中心节点做到云原生体验的自动化运维,做到GitOps自动化。

带着抽象之后的这个模型,我们在平台管理上进行了深入调研,最终选用了CNCF的云原生边缘计算项目KubeEdge来解决完成以上所有集群的统一管理。

KubeEdge是什么?解决什么问题?

KubeEdge的特点是在云边通信的资源消耗小,使用方式基于Kubernetes,上手方便,比较适合我们当前的场景。KubeEdge项目是华为云开源的一个基于Kubernetes的开放平台,并为网络应用提供基础架构支持,提供云和边缘之间的部署和元数据同步。KubeEdge具有以下几点关键优势:

容器化应用封装

» Build once, run anywhere

» 轻量化基础镜像,降低资源占用

通用的应用抽象、定义

» 业界事实标准

» 云上、边缘统一管理

松耦合的架构

» 易扩展的API框架

» 易于定制平台组件

磐舟磐基平台:基于KubeEdge的落地实践_KubeEdge_04

磐舟磐基平台的KubeEdge实践

通过对KubeEdge的应用场景分析,以及对移动内部1+31+N模型结合,我们可以将集团的“1”想象为KubeEdge的CloudCore节点、将各省公司的node节点想象为EdgeCore节点,从而就实现了1+31+N下的云边协同模型。映射到我们的具体场景是这样:

» 集群业务部署场景:把集团的K8s master节点作为KubeEdge的CloudCore节点,省公司的node节点作为KubeEdge的EdgeCore节点,CloudCore节点与EdgeCore节点连接上后,在EdgeCore上启动磐舟GitOps业务中ArgoCD pod,统一下发CD一体化的元数据,从而将省公司资源池做到方便的集群创建、集群纳管,最终方便的达成自动化GitOps交付。

» 集群自动化创建场景:基于省公司的资源池来创建磐基PaaS集群,运维人员在master节点使用磐舟GitOps,通过CloudCore与EdgeCore的通信,部署来自openEuler社区的集群自动化部署工具-eggo的实例。之后在边缘侧,就可以通过eggo来自动化完成省公司磐基PaaS集群的创建。

综上,通过将KubeEdge集成至磐基PaaS平台,成功打通移动集团与各省公司的网络,实现“1+31+N”的K8S集群全部连通、

磐舟磐基平台:基于KubeEdge的落地实践_Kubernetes_05

实现统一管理、简化多集群的运维系统、减少运营成本;同时也成功将前面提到的500台鲲鹏服务器以及它上面的BCLinux for Euler集群纳入磐基PaaS平台的大家庭之中,运维效率大幅增加。

磐舟磐基平台在多集群管理的下一步计划

在完成KubeEdge集成到磐舟磐基平台这项专项工作之后,考虑到后续不仅是由master节点纳管单个edge节点,还会考虑在将南向集群的单个节点组成一个集群,实现控制面的自动化集群部署,支撑省公司集群的控制面自动化。磐舟磐基平台计划进一步集成CNCF社区最新的集群联邦方案Karmada来完成“1+31+N”的PaaS多集群统一管理工作。

号外

磐舟磐基平台:基于KubeEdge的落地实践_KubeEdge_06

7月7日,华为开发者大会2023 ( Cloud )将拉开帷幕,并将在国内30多个城市、海外10多个国家开设分会场,诚邀您参加这场不容错过的年度开发者盛会,让我们一起开启探索之旅!

我们将携手开发者、客户、合作伙伴,为您呈现华为云系列产品服务与丰富的创新实践,并与您探讨AI、大数据、数据库、PaaS、aPaaS、媒体服务、云原生、安全、物联网、区块链、开源等技术话题,展开全面深入的交流。

大会将汇聚全球科学家、行业领袖、技术专家、社区大咖,开设200多场开发者专题活动,为全球开发者提供面对面交流与合作的机会,共同探讨技术创新和业务发展。

点击参与开发者社区活动,观赏技术大咖秀、玩转技术梦工厂,有机会赢取4000元开发者礼包!

欢迎关注“华为云开发者联盟”公众号,获取大会议程、精彩活动和前沿干货。


点击关注,第一时间了解华为云新鲜技术~

标签:PaaS,KubeEdge,落地,运维,磐舟,集群,节点
From: https://blog.51cto.com/u_15214399/6552610

相关文章

  • redis学习十一:数据类型命令及落地运用 (GEO)
    redis之地理空间GEO1.geoaddkeylongitudelatitude名称;zrangekey0-1查看如果出现乱码问题登录时候加上--raw 2.geoposkey名称获取对应经纬度 3.用geohash表示 4.geodist距离多少km/m 5.georadius这个尚硅谷的杨哥写的这个比较详细,直接截图照搬了。 6......
  • DevOps|中式土味OKR与绩效考核落地与实践
    昨天一个小伙伴和我讨论了一下OKR和绩效管理,所以这次想简单明了地说下在中国怎么做比较合适,很多高大上的理论无法落地也是空中楼阁。首先说一些,我个人的理解道德品质和能力素质决定了一个人的职位行为职位行为决定了业务结果不同级别/工作性质的人员,绩效考核应该有不同权重组合团队......
  • DevOps|中式土味OKR与绩效考核落地与实践
    昨天一个小伙伴和我讨论了一下OKR和绩效管理,所以这次想简单明了地说下在中国怎么做比较合适,很多高大上的理论无法落地也是空中楼阁。 首先说一些,我个人的理解道德品质和能力素质决定了一个人的职位行为职位行为决定了业务结果不同级别/工作性质的人员,绩效考核应该有不......
  • 基于ChatGPT函数调用来实现C#本地函数逻辑链式调用助力大模型落地
    6月13日OpenAI官网突然发布了重磅的ChatGPT更新,我相信大家都看到了,除了调用降本和增加更长的上下文版本外,开发者们最关心的应该还是新的函数调用能力。通过这项能力模型在需要的时候可以调用函数并生成对应的JSON对象作为输出。这使开发人员能更准确地从模型获取结......
  • redis学习十:数据类型命令及落地运用 (HyperLogLog)
    需求:统计某个网站的UV,统计某个文章的UV(UV,uniquevisitor,独立访客,一般理解为客户端ip,需要去重考虑);用户搜索网站关键词的数量(非同一个ip);是什么:去重复统计功能的基数估计算法——HyperLogLog;基数:是一种数据集去重后的真实个数————全集{1,2,3,4,2,3,3}  基数{1,2,3,4}=4用......
  • redis学习九:数据类型命令及落地运用 (bitmap)
    redis位图bitmap:由0和1状态表现得二进制位的bit数组需求:用户是否登录过Y,N,比如京东每日签到送豆;电影,广告是否被点击播放过钉钉打卡上下班大厂签到必备是什么:用于状态记录,Y,N不用去mysql读写。1.bitmap的偏移量从0开始,setbitkey0/1设置对应下标值图中就是1000010,对应as......
  • redis学习八:数据类型命令及落地运用 (Zset)
    有序,附带分数,适用于排行榜1.zaddkeyscore1v1score2v2新增键值对;zrangezsetstartend查看对应范围值zrangekeystartendwithscores带着分数查看;zrevrangekey倒序查看,用法和zrange类似; 2.zrangebyscorekeyminmax取分数范围内的value;也可以在前面加上(是不......
  • 南岸区装机容量最大的屋顶光伏项目落地与光伏云平台的介绍
    安科瑞虞佳豪6月15日,位于美的股份有限公司屋顶10千伏高压光伏工程正式并网投运。项目总装机容量峰值为13.413兆瓦,采用“自发自用,余电上网”的运行模式,是目前南岸区装机容量最大的屋顶光伏项目。​在现场,坐落在美的股份有限公司厂房上的光伏电站呈现出一派壮观的景象——一块块......
  • 微博HDR视频的落地实践
    社交平台以日渐成为我们日常生活中不可或缺的一部分。从文字、语音再到视频,用户对社交平台中的视频类信息越发依赖,这也促进了视频体验优化的发展。随着HDR的普及,微博用户也希望获得更好的视频体验。本次LiveVideoStackCon2021音视频技术大会 北京站,我们邀请到了微博客户端播放器......
  • VVC为什么首先在印度落地?
    如果一个市场对流量格外敏感,在计算复杂度提升不多的情况下,一款新的编码标准就有了市场。印度正是如此。文|包研9月10日消息,MXPlayer宣布在印度市场支持VVC编码的视频服务。据TNW报道,“大约20%的设备能支持VVC解码”,MXPlayer首席产品官SiddharthMantri表示。VVC这一新视频编码......