首页 > 其他分享 >如何做好今天的运维

如何做好今天的运维

时间:2023-04-23 11:37:25浏览次数:51  
标签:运维 人工智能 系统 业务 做好 维和 今天 架构师

近年来很多声音讨论运维岗是不是会被替代的问题。

如何做好今天的运维_架构师

如何做好今天的运维_SRE_02

但随着ChatGPT的出现和更多大模型的发布,似乎每个岗位都应该考虑下自己被替代的问题了。

无论未来如何变化,现实是今天的我们仍然需要做好自己的工作,站好自己的岗。今天我将分享我所认为的优秀运维和架构师应该是怎样的。最后是关于运维将给人工智能时代带来哪些价值的些许思考。

运维和研发架构师一样,通常是从整体来维护和掌握业务的架构。但同一个工作的深度实在是良莠不齐,差距在哪里呢?


要做好一个优秀的运维或架构师,所需要的素质和能力有很多,但尤其重要的一点是对自己所负责系统和业务的了解深度!

运维和架构师工作的本质是让这个业务稳定高效的运行,而要达到这个目的的前提就是对所负责的业务了如指掌。

对一个业务和系统的了解包括:

* 对业务要产生的用户价值的了解
* 对业务系统中整个业务流程是如何运转的了解
* 对业务系统中各个核心功能的了解
* 对支撑这些核心功能运行的服务模块和组件的了解
* 对线上服务部署架构的了解
* 对线上服务的基础设施和资源的了解,物理机/服务器/容器/公有云。。

以及基于这些信息能够做出的监控、预案等技术方案。哪些监控是重要的,哪些预案是必要的,出现故障时可以舍弃哪些功能,优先恢复哪些模块,业务继续发展线上和架构上的瓶颈会在哪里?等等。

上面这个层次也许不全,但大致是这样。大多数运维或研发入职后就像一颗螺丝钉一样被放置在自己的岗位上,运维最先接触的东西可能是底层的这部分,而后有些人能往上走,很多人一直在底层徘徊。

当大多数运维同学被问及自己的核心竞争力时,往往迷茫,但如果你掌握了上面的整个业务知识体系,你的岗位实际已经离不开你。

十几年前我入行互联网运维的时候,非常不理解研发写了一个系统运行在线上,而且不是开源的,然后我需要费老大劲去了解这个专用系统,这对我来说意义有多大?但我发现周围较我更早入行的运维老手,个个都对自己负责的系统十分熟悉,甚至细化到线上模块一个配置项的含义。

后来我入职时的导师,在给部门的同学做晋升答辩分享时,开篇时说了一句话,大致是:首先把自己负责的业务介绍一遍。

这一句话让我突然意识到自己的工作似乎有所不足。是的,这就是问题,你的工作职责是负责维护好一个系统,但你却并不了解它,严格讲这是不称职的,职级越高越是如此。

所以要做一个优秀的运维和架构师,首先要夯实上面每一层的能力和信息。

但话说回来,现在的运维为什么已经不像之前的运维那样能够深入服务和业务了呢?


原因主要有几点:

  1. 互联网和IT系统的业务变得越来越复杂
  2. 微服务和高速的迭代进一步加剧了系统的复杂度和掌握的难度
  3. 服务梳理后沉淀的文档发挥的价值范围和时间都很有限
  4. 面对复杂的业务,缺少好的方法来建设一套合理的运维体系



如今,云原生、微服务等等技术让业务系统获得了巨大的进步,有没有方法和产品能让运维和架构师掌握业务系统的能力也获得进步呢?


这就是我们团队在致力解决的问题。我们希望实现一个结合了方法论和最佳实践的产品,并希望这个产品能够沉淀经验,越用越有价值,让运维和架构师通过这个产品能够轻松的掌握和理解自己的系统。

对详情感兴趣欢迎了解 => Flashcat

回到如今已无可回避的人工智能问题上,人工智能会不会颠覆一切,让如今的工作都变得没有意义?


就如今的人工智能技术而言,人工智能需要有价值的数据输入才能获得有价值的输出。

而我们现阶段的工作是在构建业务系统数据的意义和价值,未来这些数据将成为人工智能真正进入运维领域的基础。相信在人工智能普及的将来,我们今天为运维工作所做的努力仍然具备很高的价值。

标签:运维,人工智能,系统,业务,做好,维和,今天,架构师
From: https://blog.51cto.com/ulricqin/6216907

相关文章

  • 历史上的今天大事件查询工具推荐 - 历史上的今天 API
    引言历史上的今天,总会有一些特别的事件发生,这些事件对人类的发展产生了深远的影响。想要了解这些事件,往往需要花费大量的时间和精力去查阅历史资料。但现在,有了历史上的今天API,一切变得方便了许多。如果你对历史感兴趣,那么历史上的今天API肯定是你不可错过的神器!这是一个可以......
  • 运维 —— IMP-00030: failed to create file import_sys for write
    IMP-00030:failedtocreatefileimport_sysforwriteIMP-00000:Importterminatedunsuccessfully原因:操作系统用户oracle对dmp文件没有权限drwxr-xr-x 2root  root       42Feb 316:57dmp_dir解决办法:登录root用户,对用户oracle赋予dmp文件一些权限在root......
  • ant design of vue的a-rang-picker时间控制既不能选今天以后的日期且开始时间跟结束时
    在项目中这个问题在困扰我,虽然我知道它是有一个Api是disableDate来控制时间的选择;但是只能够实现开始时间跟结束时间之间差不能超过3天。效果图接下来就是代码时间呀<a-col><a-form-model-itemlabel="任务时间范围"prop="priceRangeDate"><a-range-picker......
  • 阿里云1+X云计算开发与运维实战——在ECS中部署容器化应用Nginx
    1.1 实验概述开始实验后,系统自动创建一个Linux的ECS实例。根据实验步骤操作说明,安装Docker应用,熟悉Docker的基本指令,拉取容器化应用Nginx的镜像,部署Nginx应用,最后验证部署结果。1.2 实验目的熟悉Docker的安装和基本指令,熟悉部署Docker应用基本方法。1.3实验架构1.4实验准备实验......
  • 阿里云1+X云计算开发与运维实战——使用kubectl命令行工具对容器进行操作
    1、实验概述使用Kubectl 命令行工具操作 kubernetes 集群是最直接的管理集群的途径。开始实验后,系统自动在阿里云上创建一个Kubernetes集群。根据实验步骤操作说明,远程登陆集群master节点,然后使用kubectl命令行工具,对集群进行基本操作。包括创建资源对象,显示和查找资源对象,更新......
  • 阿里云1+X云计算开发与运维实战——使用弹性伸缩调整弹性计算资源
    实验概述开始实验后,系统会自动创建一台部署了WEB服务器的ECS实例。首先,登陆到阿里云管理控制台,创建该ECS实例的自定义镜像,用于之后的弹性伸缩。然后,使用阿里云弹性伸缩服务,实现ECS实例的定时自动弹性扩容,从而满足在高并发的时候,系统仍然可以正常提供服务。最后,仅清理所有使用阿里云......
  • 阿里云1+X云计算开发与运维实战——使用云监控和弹性伸缩实现弹性架构设计
    实验概述本实验会自动创建2台部署了云监控插件的ECS实例。首先,配置负载均衡实例的监听配置,创建ECS实例的自定义镜像。然后,在创建弹性伸缩服务,配置报警任务,将已创建的ECS实例加入伸缩组和负载均衡实例后端。最后,增加ECS的CPU使用率达到100%,通过弹性伸缩服务,自动新建ECS实例并添加到......
  • SRE接手新业务首要工作:运维准入测试
    如果接手的是一坨随时可能散架的破车,就算SRE有通天之能,也很难通过运维手段给变成布加迪威龙。接手的时候一定要做好准入测试!很多公司会有运维准入规范,但是通常缺少运维准入测试,导致了后续诸多背锅问题。前言你可能会遇到下面的问题:告诉研发做架构设计的时候要叫上运维做review,研发......
  • 阿里云1+X云计算开发与运维实战—— 使用负载均衡实现https与http的混合访问
    实验概述    互联网巨头雅虎官方对外发布消息,承认在2014年的一次黑客袭击中,至少5亿用户的数据信息遭窃。此次事件让我们再次意识到网站安全的重要性,网站加密防护的必要性。我们可以使用HTTPS协议对网站进行全站加密,但是,大部分用户已经习惯直接输入域名(即使用 HTTP 协议)访问网......
  • 阿里云1+X云计算开发与运维实战——负载均衡使用初体验
    本实验通过使用阿里云负载均衡SLB以及对负载均衡SLB后端服务器ECS的权重进行修改,可以快速解决上述的问题。实验目标 完成此实验后,可以掌握的能力有:配置负载均衡SLB的监听规则,并将ECS实例部署到SLB后端;通过设置负载均衡SLB后端服务器ECS的权重值,分配用户访问后端ECS实例的比例。背景......