CaseStudy规范概括 什么情况要写:线上问题客诉数量超过3个,并且RD操作回滚或发版修复了此问题 谁来写:推动或操作回滚、发版修复了此问题的RD 复盘时间要求:故障在处理结束后,3天之内写完COE并发出链接,一周之内组织会议进行复盘 为什么要写CaseStudy 目的:避免再次发生,消灭潜在隐患 如何写CaseStudy 方式:
- 摆正心态(不为了追责,也不要担心得罪他人)
- 过程记录(时间和事件)
- 影响评估(影响范围和公司损失)
- 原因分析(深入分析原因,5why分析法)
- 事后改进(任务TODO,SMART原则)
- 机制沉淀(最佳实践、SOP、checklist等)
- 分享学习(对内自我提升)
- 他人借鉴(对外共同进步)
- 用户反馈的线上问题,影响了用户的正常使用,或造成公司的损失
- (客诉数量超过3个)
- RD操作了系统回滚,回滚之后用户恢复正常使用,或停止了损失产生
- 故障在处理结束后,责任团队需要在
- 3天之内
- 完成CaseStudy撰写并发到群里,
- 一周之内
- 组织会议进行复盘
- 影响的业务方(PM)
- 相关客服人员
- 相关值班群、应急群
- 监督人(架构组山竹、QA生地)
- 其它相关人
- 当事人RD
- 影响的业务方(PM)
- 对应的QA
- 监督人(架构组山竹、QA生地)
- 其它相关人
- 页面标题模版“CaseStudy-YYYYMMDD-团队-故障标题”
- 故障标题要具体,如写“服务中断10分钟”,而不是“服务故障”,如写“导致用户不能下单”,而不是“订单系统报错”