首页 > 其他分享 >运维转型之路 —手工运维到无人值守的自动化运维,从根本实现降本增效

运维转型之路 —手工运维到无人值守的自动化运维,从根本实现降本增效

时间:2022-12-02 15:45:52浏览次数:41  
标签:运维 实现 平台 用户 降本增效 监控 自动化 运维到

运维伴随信息技术的发展而生,经历了从手工管理到工具化运维,发展至平台化运维,最终实现自动化、智能化运维的四个阶段。

 

图一:运维发展阶段及特点

在信息化发展初期,业务流量不大,服务器数量相对较少,系统复杂度不高。此阶段缺少运维工具和操作流程、标准,运维工作的开展主要依赖于个人知识、技术及经验的积累。

随着服务器规模、系统复杂度的增加,全人工的操作方式已经不能满足业务的快速发展需要。此时运维进入工具化阶段,在此阶段运维流程、标准等开始建立,运维人员逐渐开始使用工具进行管理,针对不同运维操作出现了不同的脚本程序。

在第三个阶段,网络架构异构,运维需求迭代频繁、快速,同时对于运维效率和误操作率有了更高的要求,用户开始建立运维平台,进入平台运维阶段,此时,手工执行脚本逐渐转化为平台化操作,运维数据更加可视,运维实现跨团队线上协作,运维效率、质量有了极大提升。

在业务逐渐庞大、海量数据不断积累的阶段,随着AI技术的逐渐成熟,运维逐渐步入智能运维(AIOps)阶段,目前大多数用户和运维厂商都处于实践初期,基本实现单一场景智能化、自动化处理,并向机器决策、无人值守运维模式探索。

以大数据为支撑,保障运维数字化转型

随着人工智能技术的不断深入,人的角色主动性不断提高,对数据和平台的掌控能力不断增强。在采集到原始数据后,通过大数据分析可视化,进行标识、编排、模型预训练,将结构化的知识抽取,最终将专家的知识经验衍生为可重复应用的知识体系,从而固化到平台中,进而显示运维平台的自动化和智能化升级。

图二:北京智和信通自动化运维平台架构

作为逐步进入智能化运维阶段的自主研发运维工具企业,北京智和信通技术有限公司重点关注“万物互联”理念,在传统运维的基础上,以更具智能化、更具安全性为研发方向,形成全栈式立体运维监控产品体系。融合人工智能、大数据、物联网等技术,提取静态数据(历史数据)和动态数据(实时、流式传输数据),通过数据采集、数据存储、数据治理,聚合有效数据,配合自动化程序,逐步实现无人值守的运维响应。

以AI智能为武器,实现“真自动化”运维

近些年,运维更关注用户体验,重视响应时间、可用率等性能指标,在对基础设施、数据库、中间件、存储、物联网等设备进行运维监控时,需求更具扩展能力、模块化、可分布式部署的产品与解决方案,在故障发生时第一时间定位问题,快速进行根因分析。

北京智和信通自动化运维解决方案以万物场景为基础,以构建持续发展、万物感知的智能安全运维为目标,将网络拓扑、监控、安管、资产、数据分析、可视化展示、日志分析、工单、流量监测等核心产品以“积木式”的开发方式进行结合,在实际应用中根据用户的需求场景灵活组合,实现“真自动化”运维。

(一)万物管控的基础监控采集能力

以提供全方位网络监控功能,全面管理联网设备为目标,深入用户需求,实现个性化网络监控解决方案。实现全栈不同类型、不同品牌、不同型号的IT设施统一监控。可无限新增设备监测指标。从应用系统、网络设备、存储、数据库、中间件到应用、动环,全面监管。

 

(二)复杂网络直观展示的拓扑可视能力

自动生成拓扑图,支持物理网络拓扑和逻辑网络拓扑,通过平面或立体的展示方式,直观展示网络中各设备、接口间连接关系。整体网络结构透明可视。

 

 

(三)网络全流量数据分析展示

基于网络流量分析技术,采集、分析、存储所有网络流量,通过回溯分析数据包特征、异常网络行为,以多维数据分析和深度挖掘为手段,实现数据包层面的流量追踪,发现潜伏于网络中的未知攻击。

 

(四)平台级可视化运维编排能力

提供可视化编排工具,支持以拖拽的方式快速简单的完成作业流程的配置,将复杂的运维工作和任务转变为一致的,可复用的、可度量和有效的工作流,实现自动化运维。

 

 

(五)故障实时预警,快速自愈

以网络故障监控、设备性能监测为基础,结合网络流量侦测功能,动态发现网络故障。智能判断告警类型及级别,自动触发预设的故障解决流程,复杂告警指派工单专人处理,常规告警触发安全策略全自动处理。

(六)规范化、自动化安全编排

以安全设备分析和异常告警安全事件为输入,通过编排和执行安全作业流程的方式,将设备安全事件的处理及内部事件管理流程进行结合,完成原来需要多人多系统多界面在线协同才能处置的安全事件,降低人员依赖,保障应急处置质量。

 

(七)周期性作业调度自动执行

将周期性、重复性的批处理作业,如巡检、应用部署等,固化为自动化作业流程,通过配置时间规则,在指定时间进行调度。从而实现周期性工作的自动化,仅需关注相应的作业执行过程、执行成功与否以及执行结果,规范大多数周期性运维操作。

(八)深入设备底层的控制和调配能力

深入设备、资源、协议层面实现深度管控,基于多种协议进行统一安全管控、设备控制规范配置。支持周期性、批量设备控制策略执行,将繁复的设备运维工作转化为自动执行的管理策略,全面解放人力。

 

 

(九)海量异构数据聚合分析呈现能力

提供可视化数据分析能力,对网络海量数据进行图形化分析展示。通过直观的图表和图形化手段清晰有效的将运维数据分析结果进行传达,帮助用户由宏观到微观更快地了解网络运维现状,做出更具时效性的决策。

 

 

(十)运维工单高效协同流转

结合用户需求实现定制化运维工单,通过自动触发与用户报修等方式快速响应运维事件,解决突发故障和请求,实现整个运维流程规范化、标准化,运维协同高效透明,运维结果可查可控。

 

(十一)资产全生命周期监管

通过资产实物与运维数据库的一一对应,为用户提供更加便捷高效资产生命周期管理,资产跟踪、维护和统计分析。动态监测已纳入监控的资产运行状态,并对资产运行情况进行分析,通过状态数据采集分析,预估资产将面临的风险,驱动资产维护保养。

以二次开发平台为基座,支撑差异化敏捷部署

基于模块化的搭建形式,充分利用软件已有功能,提供多种开发模式和可拓展的框架模块供用户选择。在通用功能的基础上,开发人员选择API或代码的开发形式,以便在最短的时间内满足用户各种定制需求,提高研发效率。

平台内置6种开发模式,超50种开发组件,真正做到代码级开放,满足各类运维场景的差异化需求。

结语

纵观运维的发展,企业和用户都希望运维工作高自动化起、智能化,实现基础资源合理利用,业务环节高效监控,异常自动分析处置,减少人的重复劳动,降低知识传递和保存的成本,运维交付更加高效、更加安全。

 

 

标签:运维,实现,平台,用户,降本增效,监控,自动化,运维到
From: https://www.cnblogs.com/zhtelecom/p/16944656.html

相关文章