首页 > 其他分享 >「笔记」某移动SRE运维体系交流

「笔记」某移动SRE运维体系交流

时间:2022-12-14 10:13:48浏览次数:34  
标签:连续性 运维 SRE 专业组 故障 笔记 运维岗

痛点

  • 传统竖井式IT架构(封闭、隔离、非标、难运维)
  • X86 服务器硬件稳定性不足
  • 开源软件可靠性不足,且不可控
  • 出了故障,被动救火救不完

转型

由此催生了转型升级的需求:

  1. 运维智能(SRE)的转型

SRE运维模式

核心职责

保证:

  1. 业务连续性
  2. 应用连续性
  3. 平台连续性

职责分工

  1. 综合运维岗
    1. 7*24 在线或远程值班
    2. 业务监控
    3. 业务运维操作
    4. 故障处理
    5. 应急处理
  2. 运维专业组(由基础架构的:主机、存储、网络、中间件、数据库岗位演化而来)
    1. 系统架构梳理和优化
    2. 新建系统评审
    3. 故障演练
    4. 新技术引入
    5. 专业职责和经验赋能给综合运维岗,如提供数据库自动化脚本、数据库切换演练流程标准化等
  3. 运维开发
    1. 为综合运维岗开发运维工具、运维系统
    2. 收集分析运维专业组自动化、监控等需求
    3. DevOps、自动化运维、智能监控系统、容器平台等系统开发和持续迭代演进

综合运维岗 - 全栈运维入口

要点

  • 全面运维
  • 工具应用
  • 统一入口
  • 人才培育

标签:连续性,运维,SRE,专业组,故障,笔记,运维岗
From: https://www.cnblogs.com/east4ming/p/16981340.html

相关文章