【摘要】
2022年6月,我作为系统规划与管理师参与了火火省自然资源系统全媒体采编与数据分析应用云平台的运维服
务项目,合同金额为343万元,运维工期为1年,本项目主要包括云平台采编中心、舆情中心、影像中心、统计中
心、地图中心、策划中心6个子系统的日常监控与维护,主要是为平台提供系统维护服务、性能优化服务以及数据
处理实施服务,目的是保障系统的连续性和可用性,及时解决突发的故障。平台至今运行稳定,状态良好。本文以
该项目为例,结合我任系统规划与管理师工作期间的一些经验和做法,结合知识管理的重要性及风险控制,重点讨
论了T运维服务项目中的知识管理的获取、共享、保留归档、评审四方面内容。
【正文】
2022年6月,公司承接了火火省自然资源系统全媒体采编与数据分析应用云平台的运维服务项目,该项目投资
343万元,运维工期为1年,我作为系统规划与管理师全程参与项目运维服务。客户是x省自然资源宣传中心,主
要负责xx省自然资源新媒体相关的信息化建设与运营。该项目集成了采编中心、舆情中心、影像中心、统计中心、
地图中心、策划中心六大功能模块,采用“中央厨房式”的信息资源处理模式,整合x省各市县新媒体信息资源,
接入省级门户网站可公开的信息系统,提供手机端自然资源便民服务,主动监测舆情,为功能强大的政务宣传融合
平台。由于系统部署在xx省政务云平台,网铬环境为政务外网,主要用户为全省自然资源系统的通讯员,所以客
户对其可用性、连续性和稳定性要求较高,一旦出现中断或故障,将对数据交换工作带来较大影响,为了保障系统
运行的稳定些和可靠性,出于数据安全的考虑,我们组建的T服务团队共12人,其中管理人员3人,服务台操作
人员4人,技术支持工程师5人。我司以现场驻点+远程运维服务模式,采用58小时现场值守、724小时不间断
故障响应服务开展该云平台的运维服务工作。运维工作主要包括系统维护服务、性能优化服务以及数据处理实施服
务。
由于运维服务的工作强度比较大,团队人员平均年龄较小,经验相对不足,造成人均工作负荷较重,且由于原
有人员的经验和运维事件处理方法并未落实在书面,新入职人员对原有运维流程和常见问题的处理操作生疏,造成
客户满意度下降。因此,做好项目的知识管理工作尤为重要。本文以该项目为例,结合我任系统规刻与管理师工作
期间的一些经验和做法,结合知识管理的重要性及风险控制,重点讨论了T运维服务项目中的知识管理的获取、共
享、保留归档、评审四方面内容。
一、知识获取
知识获取是T服务知识管理的首要步骤,结合我负责的项目而言,知识包括两类,大部分是存在于团队成员头
脑中的隐性知识,还有几种不同种类(现行的政策标准、本项目的SLA、客户响应流程等)的显性知识。作为本项
目的系统规划与管理师,结合服务类项目的特点,在运维项目启动后,我们的运维团队通过头脑风暴,结合服务台
的报告反馈,收集该系统的使用人员提出的常见或有必要的知识进行汇总会并分类,需要沉淀的知识范围大致分为
三类,以设备应用为核心的技术类、以标准流程规范为核心的管理类以及以客户为核心的事务类,而在技术上细化
为四级,其中一级技术类如采编中心、影像中心的知识,二级设备应用类如前置机的处理解决方法,三级网络交换
机如地市异地端口的接口数据处理方法,四级参数配置如地图中心、统计中心的权限设定,并注明信息获取来源。
二、知识共享
知识分享主要是制定知识共享制度,对各种知识设定保密级别。由于我负责的项目不属于涉密项目,考虑到项
目知识库涉及共享的人员范围广,因此我将本次建设的知识权限级划分为三类,项目内部、公司内部和公共,其中
项目内部和公司内部又按照不同职责进行了划分,如项目内部的权限划分又包括服务台人员、技术支持人员、管理
人员、系统端口通讯员。公共部分的知识主要以公开的软硬件使用标准为主,如火火省自然资源系统全媒体采编与
数据分析应用云平台使用说明书,面向客户开放。
由于本项目中绝大多数有效的知识都是来源于团队经验的隐性知识,而隐性知识的最直接来源是经验丰富的团
队成员,因此人在知识管理的过程中起到了非常重要的作用,也是最大风险点,为了减少员工不愿意与其他员工共
享自己所有用知识的现象出现,因此,为加强知识共享的程度,鼓励个人对知识共享的贡献,我组织团队编制了一
系列的知识管理制度,包括《知识管理考核与奖惩机制》、《知识管理信急采集管理功法》等制度,并修订了日常
考核机制,在月度绩效中加入了每月贡献有效知识条目的考评项,将知识提交、共享与绩效考核挂钩;同时为避免
某一使用者恶意将项目建立的知识库内容全部打包下载,外泄部分商业机密和核心知识,除了在初期建立共享安全
制度,并对识进行密级界定外,还在平台中对知识的查阅进行了权限控制。
三、知识入库
知识入库时需要按照事先规划的分类进行保存,入库时进行审核。在当前各类信息鱼龙混杂的情况下,知识的
真伪和优良需要进行鉴别后才能确定出有效的信息,真正对日常运维管理工作起到支挥作用。信管网在项目启动
初期,我们团队围绕问题发生数量对原有的知识库进行核查,如对系统中基于gs应用、大数据舆情检测及分析
检测等功能的运行状态测量并提出数据,发现原知识库管理有缺陷。因此我向公司申请了2名资深工程师,按照规
定程序采购了某公司的知识管理平台,在知识管理建设初期对每一条入库的信息进行审核,确保信息来源可靠且真
实有效,同时由资深工程师建立信息间的关联,形成知识地图,便于项目组成员快速应用。结合日常运行过程中发
现的新媒体数据量冗余、人员技能不足、运维工具落后等存在的问题,我们设计了服务改进计划以及知识库更新计
划,知识入库主要按照T服务运维对象如平台管理员及端口通讯员,以及新媒体业务数据处理两个维度分类保存,
团队根据知识库更新计划进行实施,涵盖人员、资源、技术及过程四要素,每个环节都会由资深工程师把关审核,
并将知识入库的内容发放至客户主要干系人进行确认。
四、知识评审
知识库运转起来后,需要定期组织技术专家团队对知识库的知识进行全面的知识评审。我要求服务团队在日常
运维工作中,针对典型故障进行解决方案的总结与积累,定期对知识进行评审,确保知识的时效性、完整性、正确
性。通过本项目中采购的知识管理平台,我们制定了每条知识进行评价打分机制,每季度固定生成报表包括信息的
使用率和评价,对于评价不高或者有评价说时效性不强的信息,系统自动进行筛查后,并组织客户中系统主要干系
人对知识库内的信息进行定期评审。比如xx省自然资源宣传中心的前置机经常出现宕机,是由于每日抽取的新闻
包数据量较大,前置机性能不足,在升级前置机配置以解决经常宕机的问题后,我们对技术更新进行培训与知识转
移,制定相应的使用手册,使升级后后前置机配置能平滑地投入生产,从而提升团队的整体T服务质量。
2023年6月,本运维合同到期,通过我和运维团队的不解努力,顺利院成了运维工作,保证了系统的正常运行,
赢得了客户方的一致好评,并顺利和客户签署了下一期的运维合同。在服务过程中,还存在着一些小问题,但经过
我后期的努力,问题都得到了解决,项目内部逐步由忙乱无序向有条不紊的学习型组织过渡,凸显了知识管理对于
T运维服务的必要性和重要性。