首页 > 其他分享 >SRE(运维工程师)成长路线

SRE(运维工程师)成长路线

时间:2023-03-23 15:33:05浏览次数:42  
标签:运维 宇航员 工程师 SRE PO1 玛格丽特

第一个运维工程师

一天,玛丽的儿子劳伦在摆弄 MIT 。当她在键盘上乱按的时候,一条错误信息突然出现。劳伦不知怎地启动了一个叫做 PO1 的预运行程序,原本正在飞行状态的模拟器一下子崩溃了。

虽然一般来说宇航员不会犯这样的错,但玛格丽特还是想加一段代码防止这种状况的发生。这一提议被 NASA 否决,[他们一遍又一遍地跟我说宇航员不会犯任何错误,他们被训练得近乎完美,,玛格丽特说。她转而加了一句程序说明,所有 NASA 工程师和宇航员都能看到:[不要在飞行过程中按下 PO1]。她回忆说,[所有人都说,[那样的事情永远都不会发生]。]

但事情的的确确发生了。时间大约在1968年的圣诞节,进入阿波罗8号飞船的第五天飞行,宇航员吉姆洛威尔(im Lovell)不小心在飞行中启动了 PO1 程序。当电话从休斯顿打来的时候,玛格丽特正在仪器实验室的 2层会议室。启动 PO1程序导致此的导航数据全部清空,阿波罗计算机无法计算出如何返回地球。

多亏了玛格丽特,还有调皮的劳伦,阿波罗号上的宇航员才得以重返地球

我对运维的理解

运维的技术含量低?

  • 承上启下,厚积而薄发的岗位
  • 可以做的很深,也可以做的很广

运维到底学什么技术

  • 操作系统/硬件/开发/算法/
  • 业务理解和掌控

运维跟SRE关系

  • SRE目前在国内大厂专指业务运维
  • 百度、字节、美团等SRE都是指业务运维

我对SRE的理解

SRE的全名:Site Reliability Engineer (网站可靠性工程师)。
来说一下我对SRE的理解,SRE是最根本的目标是时刻保证线上的稳定和安全。
如果说线上服务是上帝,那么SRE就是网址的专职医生。

对于专职医生的职能体系包括:
1.健康检查和指标观察
2.快速诊断
3.快速治疗
4.疾病预防
5.专项提升

那么对于SRE工程来说,同样对应的工作体系包括:
1.监控发现:线上指标的检查和监控
2.快速定位:如何快速发现问题
3.止损体系:线上止损、日常操作
4.预防体系:容量规划和预测,架构优化等等
5.活动体系:节假日大型活动

SRE的三个核心工作 :定性、成本、效率
稳定性是基本盘

标签:运维,宇航员,工程师,SRE,PO1,玛格丽特
From: https://www.cnblogs.com/netflix/p/17247590.html

相关文章

  • 【数仓运维实践】关于GaussDB(DWS)单SQL磁盘空间管控
    摘要:本文主要讲解数仓运维中遇到单SQL磁盘空间管控问题的解析和方案。本文分享自华为云社区《GaussDB(DWS)运维--单SQL磁盘空间管控》,作者:譡里个檔。【问题描述】执......
  • 技术干货 从DBA视角看数据库运维管理平台
    GreatSQL社区原创内容未经授权不得随意使用,转载请联系小编并注明来源。GreatSQL是MySQL的国产分支版本,使用上与MySQL一致。作者:z文章来源:GreatSQL社区原创DBA岗位......
  • 关于微服务的自动化部署+运维,于企业发展的思考,技术性路线实践
    1、背景这段时间由于各人原因需要了解java系统部署方法。之前没有系统学习过,所以只能参考公司现有的系统部署架构。在这个学习的过程中有了个人的一些感悟+踩了一些坑。往下......
  • 工业锅炉设备远程监控运维
    ​我国是全球工业锅炉生产应用数量最大、应用范围最广泛的国家,规模以上锅炉生产企业有千余家。我国工业锅炉容量小、数量大、布点散、能耗高,无法做到集中管理和控制,对于锅炉......
  • [深入vue3之refs] ref、unref、toRef、toRefs、isRef、customRef、shallowRef、trigge
    ref接受一个内部值并返回一个响应式且可变的ref对象。ref对象仅有一个.valueproperty,指向该内部值。如果将对象分配为ref值,则它将被reactive函数处理为深层的......
  • 测试工程师的工作
    theme:channing-cyan测试这份工作确实入门相对来说是比较低的,看起来谁都能做,但是不一定谁都能做好,并且在一些小公司里面,测试往往还会被其他人认为是没有技术含量的工作,......
  • TiDB运维命令
    查看TiDB参数查看configshowconfigwherenamelike'%%';查看参数showvariableslike'%%';#pd-ctl中configshow[all]Dumpling工具下载示例#dumpling导......
  • 运维工程师之日常巡检
    #情境最近面试过程当中,发现好多运维工程师日常工作内容中,有一项周而复始每天都要做的事巡检服务器资源信息(如:CPU,硬盘,内存...)作为一个技术人,起码的懒人意识应该要有,同样的......
  • GaussDB(DWS)运维:导致SQL执行不下推的改写方案
    摘要:本文就针对因USING子句的书写方式可能导致MERGEINTO语句的执行不下推的场景,对USING子句的SQL语句进行改写一遍,整个SQL语句可以下推。本文分享自华为云社区《​​GaussD......
  • 软件测试工程师的自我修养是什么?
    1.对异常的敏锐“嗅觉”软件测试需要善于发现产品中存在的不足。不仅仅是从系统使用的正向看产品是否有问题,还要从用户角度出发,去设想产品的行为是否存在问题。正......