首页 > 其他分享 >运维问题管理

运维问题管理

时间:2024-07-26 10:54:41浏览次数:7  
标签:运维 管理 问题 事件 应用 解决

问题管理

问题的报告、受理、分派、督促、反馈、解决、跟踪、总结等工作过程

面对的问题

  • 疲于解决重复性事件和问题
  • 缺乏运维自动化:跟踪效率低,问题流转过程长;
  • 流程性工作繁重:缺乏沉淀,难以形成问题库和深度挖掘分析底层原因和问题间关系
  • 难以把控运维全局:不利于工作总结和持续优化

应用问题的一些基本定义

应用问题:

  • 对应用系统在生产环境中发生的技术业务事件进行深入研究,明确事件产生的根源。

应用问题管理:

  • 对问题的提炼、分析、解决和总结等活动进行管理的过程

应用问题管理的目标:

  • 对应用系统运维过程中的问题进行调查分析,找到其根本原因和解决方案并实施,将应用系统错误对业务产生的影响降到最低,防止其再次发生,提升系统的稳定性。

应用问题的来源:

  • 包括但不限于各渠道反映的生产系统异常或隐患事件,经分析认定为应用问题的。
  • 对于非技术性问题、业务需求,与应用系统无关的运行问题等情况,不属于应用问题范畴。

应用问题的分类

从问题来源的角度可划分为事件问题与一般问题

  • 事件问题:直接来源于生产运行事件的应用问题
  • 一般问题:除直接来源于生产运行事件之外的问题

从问题成因的角度(可动态调整)可分为:

  • 运行问题
  • 程序问题
  • 数据问题
  • 设计问题
  • 变更问题
  • 第三方问题
  • 业务问题
  • 测试问题
  • 其他问题

问题管理的应用成效

为实施主动式运维提供信息承载和管理的平台。

  • 信息互联互通
  • 流程集中管理
  • 主动归纳挖掘
一、实现问题管理流程电子化
通过问题管理平台的搭建,解决手工处理 问题管理工作时人工跟踪过程复杂、信息碎片化现象严重的问题,
全面记录问题处理信息及跟踪工作流,提升问题流转效率,沉淀有价值的应用问题数据。 

二、规范问题管理过程
规范问题报告、问题跟踪反馈等工作过程,
提高应用问题报告、解决、反馈的时效性,
使问题报告及反馈信息要素更加准确。 

三、有效控制问题数量
提高问题定位率及解决率
缩短问题平均处理周期

四、形成问题库,为主动运维服务
系统记录、跟踪和管理应用系统日常运维中各渠道出现的应用问题及解决过程,
在大量数据积累的基础上形成问题库并转换为知识库,作为技术资源供开发、运维过程中参考,
及时分析和判断系统运行风险,在事件发生之前发现和解决有关问题,为实施主动运维提供信息承载和管理的平台。 

事件问题根源分析报告

  • 事件问题发生时间
  • 事件现象
  • 问题分析和处理过程
  • 原因定位时间
  • 问题影响情况
  • 问题根源
  • 解决方案
  • 问题解决时间
  • 测试改进意见
  • 后续整改落实情况
  • 等等

标签:运维,管理,问题,事件,应用,解决
From: https://www.cnblogs.com/anliven/p/18324829

相关文章

  • 使用 Selenium 捕获 XHR 请求时遇到问题
    首先,我不是开发人员,所以使用ai为我生成一个代码以从网页获取xhr请求,即:https://www.oddsportal.com/football/brazil/serie-a/bragantino-athletico-pr-xx0ujiJ5/这只是一个示例。我想从该页面上的xhr请求获取分数,而不是使用其他方法(例如使用类等定位它)。对我......
  • 【YashanDB知识库】服务端是GBK编码,导致从22.2.12.100升级到22.2.13.100失败问题
    问题现象问题单:22.2.12.100升级到22.2.13.100失败现象:如下图,从22.2.12.100升级到22.2.13.100失败,报错。问题风险及影响版本升级失败,影响上线问题发生版本客户版本:22.2.12.100现在版本已经修改掉这个问题,升级比较时忽略掉"----"开头的分隔符和结果前后的空格。问题发生原......
  • 企业微信ipad协议:提升群管理效率
    产品说明`企业微信ipad协议`接口提供了企业微信的所有功能,调用简单,ipad协议摆脱了hook形式的需要开启pc客户端的方式,一个服务可支持几百号进行登录,并且不影响pc手机端登录状态,实现三端同时在线;>企业微信hook企业微信iPad协议企微hook接口企微第三方接口企微ipad协议......
  • 8个工位仅1人在岗?人员在岗离岗检测算法:AI赋能企业安全管理
    近日有网友发视频称,某单位上班时间,8个工位,却只有一名工作人员在岗,此事引起广大网友的热议。随着科技的飞速发展,人工智能(AI)和机器学习技术已经深入到我们生活和工作的方方面面。在企业管理、工厂生产、安全监控等领域,人员在岗离岗检测算法的应用尤为突出,极大地提高了工作效率和安......
  • 【YashanDB知识库】绑定参数,同一个sql多个执行计划的问题
    问题现象同一个sql有两个执行计划,是否合理?它的EXECUTIONS,ELAPSED_TIME等统计信息怎么看,是独立分开的还是统一计算的?如下图:问题影响版本tpcc测试:23.2.1.100问题的风险及影响影响EXECUTIONS等sql统计信息的计算问题发生原因同一条sql,特别是绑定参数的sql,参数类型不同,会导......
  • 基于SpringBoot+Vue+uniapp的教学资料管理系统(源码+lw+部署文档+讲解等)
    文章目录前言详细视频演示具体实现截图技术栈后端框架SpringBoot前端框架Vue持久层框架MyBaitsPlus系统测试系统测试目的系统功能测试系统测试结论为什么选择我代码参考数据库参考源码获取前言......
  • Java毕业设计-基于springboot开发的在线课程管理系统-毕业论文(附毕设源代码)
    文章目录前言一、毕设成果演示(源代码在文末)二、毕设摘要展示1、开发说明2、需求/流程分析3、系统功能结构三、系统实现展示1、管理员模块的实现1.1教师信息管理1.2学生信息管理1.3在线课程管理1.4班级分类管理2、教师模块的实现2.1在线课程信息2.2教学计划管理2.......
  • Redis缓存面试问题解析:如何有效管理缓存失效策略?
    在技术面试中,Redis缓存是一个常见的话题。面试官往往会考察候选人对缓存机制的理解以及在实际场景中的应用能力。本文将探讨一个在Redis缓存面试中经常被问到的问题,并深入解析其背后的概念和解决方案。面试问题:如何管理Redis缓存的失效策略?问题描述:在高并发的web应用中,缓存是提......
  • 人脸识别项目打包成exe的过程遇到的问题
     我最近重新拾起了计算机视觉,借助Python的opencv还有face_recognition库写了个简单的图像识别demo,额外定制了一些内容,原本想打包成exe然后发给朋友,不过在这当中遇到了许多小问题,都解决了,记录一下踩过的坑。 1、Pyinstaller打包过程当中出现warning,跟dll文件有关,将"C:\Windows......
  • [ABC363G] Dynamic Scheduling 与 P4511 [CTSC2015] 日程管理
    思路:对于插入操作,设插入\(\{t,p\}\):若当前\(1\simt\)有空位,那么就放进去。否则,\(1\simt\)是被塞满了的:首先容易想到的是找到\(1\simt\)中贡献最小的那个工作,若贡献比\(p\)还小,可以与之替换掉。但是假了,考虑这样一种情况:在\(1\simt\)外有一个更小的......