首页 > 其他分享 >阿里云杨红军:应用管理——云上资源DevOps最佳实践

阿里云杨红军:应用管理——云上资源DevOps最佳实践

时间:2022-08-15 10:23:31浏览次数:75  
标签:运维 DevOps 阿里 分组 应用 云上 资源

摘要:2022 年 7 月 25 日,云上自动化运维 CloudOps 系列沙龙_第二弹正式开启!阿里云弹性计算技术专家杨红军带来了首个分享《应用管理:云上资源 DevOps 最佳实践》,以下是他的演讲内容整理,本篇内容主要分为三个部分:

 

1.    云上资源管理和运维的工具

2.    应用分组维度资源的管理

3.    应用分组维度资源的运维和监控

 

01 云上资源管理和运维的工具

 

 

目前,围绕 ECS 的管控和运维出现了五大问题。

第一,随着业务的发展,企业云上资源数量和种类不断增加,对管理带来了挑战。

 

第二,资源的使用方、财务方对根据管理视角分账,以及成本优化的诉求明显。

 

第三,随着越来越多的业务方使用、如何安全的使用云账号和资源,对资源管理者带来了挑战。

 

第四,随着资源规模的增加,如何高效的管理运维提升效率,为运维人员带来挑战。

 

第五,云资源管理、运维的入口过多,无法找到最佳实践。

 

 

为了解决云上资源管控和运维的痛点,必须实现标准化、自动化、数据化、流程化。要实现分组分权管理,打通账号权限,加快实现审批流程化。

 

在自动化方面,要进一步提升效率,减少人肉操作,保证定时告警运维,时刻注意资源的使用情况。

 

02 应用分组维度资源的管理

 

 

应用分组主要涉及三个概念。

 

第一,应用分组的配置。在每个应用下,创建一些不同的分组们可以根据不同的环境或地域,创建不同的应用分组。从而实现多部署环境、多架构的分组。

 

第二,资源管理。支持在分组资源里,导入需要的资源,导入应用分组场景化、支持弹性扩缩容。

 

第三,资源运维。当在资源分组时,出现漏洞或安全风险,通过安全和风险管理,触发监控和事件机制。除此之外,还支持 CICD 代码的编译部署能力。

 

 

为了解决云资源数量多,种类多,管理难度大,管控入口不好找等问题。阿里云支持三十多种云资源的导入,对云资源进行统一管理

 

为了解决众多产品割裂的问题,阿里云通过分组管理,把最佳实践放在一起,方便大家快速使用这些能力。

 

为了解决资源分权、分账问题,阿里云通过标签能力,把所有的资源关联到一起。用户可以在账号的费用中心,查看你当前资源的费用分布情况,每月账单等。

 

 

以钉钉场景为例,把一部分 ECS 挂载到负载均衡上。通过应用分组,选择钉钉应用,直接创建应用。在创建过程中,所有关联关系以资源站的形式,自动创建。然后,这些资源会自动导入到应用分组,方便用户后续的管控。

 

 

接下来,讲一讲弹性扩缩容。应用管理把弹性伸缩进行集成。每个应用分组可以直接关联一个弹性伸缩组。用户可以根据业务,制定弹性伸缩的规则。系统会按照伸缩规则,进行扩缩容。

 

除此之外,弹性伸缩支持自动加入 RDS,自动关联 SLB/ALB,伸缩配置、生命周期挂钩。

 

03 应用分组维度资源的运维和监控

 

 

自动化运维支持分组级别的资源运维,能够关联资源事件和告警,用户可以任意编排运维任务,灵活可扩展。

 

在实例管理方面,常用的运维任务有发送远程命令、上传文件、磁盘清理、启动实例、停止实例等。在镜像管理方面,主要支持更新镜像、删除镜像、创建镜像。

 

在 OOS 运维编排的自定义模板中,自动化运维支持定时开关机、带宽临时升级、定时执行任意模板。自动化运维支持 120 多种云产品阈值告警,40 多种云产品系统事件告警

 

 

接下来,讲一讲监控和事件。如果把某些资源,导入到应用分组,可以查看所有的监控,比如某分组下 CPU 的利用率,负载均衡指标等等。印象特深,用户还可以配备告警相关的能力,云监控能力等。

 

除此之外,事件运维集成了五个系统事件。包括计划内运维事件、非预期运维事件、实例费用事件、实例安全事件,以及实例因底层升级需迁移事件。

 

 

在安全风险管理中,主要包括漏洞扫描,基线和云平台的配置检测。其中,漏洞扫描会定期自动扫描 Linux 软件漏洞,windows 软件漏洞,应用漏洞,以及应急漏洞。

 

 

如上图所示,用户在代码构建时,需要绑定云效企业,新建流水线,授权发布 ECS,然后关联流水线,进行代码扫描、构建、部署、测试。最后,发布到 Kubornetes 集群,阿里云容器服务,阿里云 ECS 或自有主机。

 

 

本节课帮助大家,从一个新的角度思考与理解运维及管控。让大家从资源维度,转化到应用分组视角,重新认识运维及管控

 

应用分组可以导入所有资源,并对这些资源进行管控和运维。除此之外,应用分组支持弹性伸缩,自动化运维,监控告警,资源管控等能力。

 

Q&A 环节,用户问答

 

Q1 有哪些因素会促使一个组织或企业考虑引入 DevOps?

答:如果企业资源管控的数量较大,业务较复杂,运维成本较高。可以使用 DevOps 的自动化工具,实现降本增效。

 

Q2 在 DevOps 中会遇到哪些安全相关的问题?

答:如果跟用户权限相关,可以让不同的权限的用户去执行自动化相关的工作。可以通过标签,赋予不同的权限。

 

Q3 自动化功能的 API 是否开放?

答:是的。包括资源导入,云监控,弹性扩缩容等能力,都是 Open API 的能力。可以直接通过阿里云或者 SDK 调用。

 

Q4 在业务增长的过程中,可能遇到哪些难以解决的问题?

答:随着业务成长,用户分权分账,可以通过分组或不同的标签,关联不同的角色。随着资源的增长,可以在应用分组或者用户编排控制台,设置一些自动化的工作。通过可视化,监控告警,弹性扩缩容等能力,提高资源的利用率,节约成本。

 

近期活动预告

 

高效能 才经济 | 云上自动化运维 CloudOps 系列沙龙_第三弹!即将开启!

 

资源效能与研发效能是企业运营过程中必须关注的话题,高效能甚至能成为一家企业的核心竞争力。充分利用云的弹性和自服务工具,企业将能大幅度地优化成本、提升资源与研发效能。因此,阿里云弹性计算云上自动化运维 CloudOps 系列沙龙,将以“效能提升与成本优化”作为第三弹的主题,分享相关思考与实践。

 

 

本次系列沙龙第三弹由三位阿里云弹性计算技术专家们带来,分别是:

 

标签:运维,DevOps,阿里,分组,应用,云上,资源
From: https://www.cnblogs.com/tanxingjisuan/p/16587308.html

相关文章