首页 > 其他分享 >线上问题SLA治理

线上问题SLA治理

时间:2023-05-20 11:57:46浏览次数:40  
标签:jira 处理 研发 问题 治理 及时处理 SLA 线上

背景

去年部门里很重要的OKR 就是线上问题SLA达成率,背后的核心就是需要近可能快速响应商家的咨询和反馈,服务好金主爸爸,在当前的世道下,只有服务好客户才能活下去。在H1的减员增效后,就没剩下几个技术支持了,客满、服务同学的问题大多都需要研发承接,需要安排值班的同学来承接这部分线上问题,对于研发的吞吐量是一定的损失,但好的一面也是有的,研发可以更近距离的了解自己产品的线上质量和收集商家的咨询反馈。

措施

为了达成线上问题及时处理,首先需要和开发一起约定一套线上问题处理和复盘的流程。
首先开发前后端需要各安排一个值班同学专门处理线上问题,虽然线上bug都是由开发直接处理的,但是测试也需要有一个值班介入线上问题处理,主要做的事情:

  1. 协助进行问题定位、验证和审批
  2. 关注问题处理时效和流程是否合理
  3. 每周整理线上问题,跟研发tl和产品一起过一下线上问题

在关注问题处理时效的时候,我通过写了一个机器人定时扫描快过期的问题进行通知值班和测试(不得不说飞书机器人挺好用的),来督促值班人员及时处理问题以及让测试/tl 介入关注问题无法及时解决的原因。

在初期的一段时间内,测试人员通过介入和观察超期的jira,发现了jira无法及时处理的主要原因,以及指定了相应的对策:

  1. 值班手上的jira比较多,无法及时处理;通过机器人提醒剩余处理时间可以一定程度上让值班同学按照紧要程度优先处理快过期的线上问题
  2. 值班未及时处理或者流转jira;这个也可以通过机器人提醒进行解决
  3. 线上问题较难处理或者没有较好的解决方案。这块需要找tl一起确认是否无法解决或者采用临时解决方案先保障商家能够使用
  4. 需要外部以及产品确认,直接将jira转走,但相关人没有及时处理。在流程上需要闭环,值班人需要关注经手的jira是否得到最终的解决。

在每周结束,值班人员收集和统计线上问题,跟研发tl和产品一起过一下线上问题,主要关注的是如何减少线上问题和提高问题处理的效率:

  1. 对于线上的bug,分析下问题产生的原因,如何规避类似的问题,落地一些action,如补充自动化或者技术方案设计的规范
  2. 对于SLA未达标的问题,分析SLA未达标的原因,如何优化流程或者提高效率减少未达标的问题数量;在提高问题处理效率方面,比较好的实践主要有:编写和维护值班人员手册,汇总常见问题和案例,整合排查工具,让值班人员能够快速定位。如果存在一些高频和耗时场景,研发内部可以设计和开发一些问题排查工具
  3. 对于商家的咨询问题,看下哪些是合理的建议或者是高频的问题,考虑产品进行优化或者产品编写帮助文档让商家更好的使用产品;同时开发同学有时会觉得一些线上问题是特性而非问题,当作普通咨询回复商家,这时需要大家一起看下是否合理。

通过上述的机制和措施,研发侧问题处理的规范性和效率有了一定提高。虽然站在研发侧角度看问题处理的耗时不长,但站在端到端的角度来看,还是有一些线上问题超期,很多是前置流程里的客满、技术支持同学耗时过长,导致线上问题转到研发侧时可能已经超时了。所以线上问题治理需要确保各个环节效率都比较高,目前系统已有的杀器,通过推荐算法推荐一些相似的问题来帮助客满同学快速找到答案

另外研发这边也给客满、技术支持同学提供一些排查工具,即将问题定位排查的能力赋能给他们,进一步问题解决的速度和释放研发排查的人力。

效果

业务域的问题处理达标率从H1的85%提升到了H2的95%,在这个过程中沉淀了研发aciton和产品优化项70+,帮助业务域的线上问题下降10%

标签:jira,处理,研发,问题,治理,及时处理,SLA,线上
From: https://www.cnblogs.com/opama/p/17023229.html

相关文章

  • 数据治理之各类数据概念
    元数据(Metadata):元数据是关于数据的数据,用于描述、管理和组织其他数据。元数据可以包括:数据的来源、创建时间、格式、数据质量等信息。元数据有助于数据治理过程中的数据分类、数据质量管理和数据安全性。主数据(MasterData):主数据是描述核心业务实体的关键数据,如客户、产品、......
  • 基于机器人自主移动实现SLAM建图
    博客地址:https://www.cnblogs.com/zylyehuo/基于[移动机器人运动规划及运动仿真],详见之前的博客移动机器人运动规划及运动仿真-zylyehuo-博客园参考链接Autolabor-ROS机器人入门课程《ROS理论与实践》环境配置ubuntu18.04成果图step1:编写launch文件......
  • 5大主流方案对比:MySQL千亿级数据线上平滑扩容实战
    转载于:https://mp.weixin.qq.com/s/DWUIy0Bt2Jw-lHRGm50cow1.五个方案1.1停机方案1.2停写方案1.3日志方案1.4双写方案(中小型数据)1.5平滑2N方案(大数据量)2. 平滑2N扩容方案实践2.1 实现应用服务级别的动态扩容2.2 实现数据库的秒级平滑2N扩容3.keepalived......
  • Redis Cluster两slave节点处理
    背景系统:CentOS7.6RedisClusterIP端口角色192.168.100.116380Master192.168.100.116381slave192.168.100.126380Master192.168.100.126381Slave192.168.100.136380Master192.168.100.136381Slave 因为某种原因导致(192.168.100.12)操......
  • 记一次线上空指针问题排查
    前言今天收到一封告警邮件,内容如下com.example.dubbo.filter.ExceptionFilter#invoke[traceId][DubboServerHandler-thread-19][DUBBO]Gotuncheckedandundeclaredexceptionwhichcalledbyip.service:com.example.TestService,method:testMethod,exception:ja......
  • Bela Ban's JGroups Manual Translation Serial IV - 协议栈和高级概念
    本章讨论怎么样正确使用和配置JGroups的协议栈协议,以及一些 JGroups 的高级概念。1.jGroups协议栈   我们知道jGroups是一个可靠多播传输工具包,它能够为集群中成员提供点对点,点对组的通信,所有通信通过通道完成。通道基于协议栈之上,协议栈中协议各自有自己特别的功能,这些功能......
  • 基于Gazebo搭建移动机器人,并结合SLAM系统完成定位和建图仿真
    博客地址:https://www.cnblogs.com/zylyehuo/gazebo小车模型创建及仿真详见之前博客gazebo小车模型(附带仿真环境)-zylyehuo-博客园gazebo+rviz仿真-zylyehuo-博客园参考链接Autolabor-ROS机器人入门课程《ROS理论与实践》成果图step1:准备工作安装必要......
  • 众惠数字生活正打造的线上线下新型消费平台!
    众惠数字生活是一个全新的概念,它代表着人们对于数字化生活的越来越高的需求。众惠数字生活,简单来说就是通过数字技术和互联网平台,为人们提供更加便捷、高效、安全、绿色的生活服务。众惠数字生活是数字化时代强调个性化、智能化、共享化的一种表现形式。在数字化时代,我们的生活方式......
  • 数据治理三大模式详解,治理新范式释放数据潜能
    随着世界经济由工业经济向数字经济转型,数据逐步成为关键的生产要素,企业开始将数据作为一种战略资产进行管理。数据从业务中产生,在IT系统中承载,要对数据进行有效治理,需要业务充分参与,IT系统确保遵从,这是一个非常复杂的系统工程。数据治理架构实践证明,企业只有构筑一套企业级的数......
  • 基于ORB-SLAM3库搭建SLAM系统
    参考资料ORB-SLAM3配置及安装教程ORB-SLAM3配置安装及运行环境配置Win11proVMware17ProUbuntu18.04Eigen3PangolinOpencv3.4.3ORB-SLAM3源码:https://github.com/UZ-SLAMLab/ORB_SLAM3效果图注意事项如果是新系统,没有安装git,则需要先装gitsudoapt-get......