首页 > 其他分享 >基于全息感知的智慧高速IT设施监控运维方案

基于全息感知的智慧高速IT设施监控运维方案

时间:2023-09-05 18:56:54浏览次数:39  
标签:运维 管理 高速公路 全息 监控 高速 感知 设备

作为智能交通的重要细分领域,建设智慧高速是实施交通强国战略的重要基础。在信息化时代,交通行业已经依托信息化建设取得了显著的成果,其中以收费网络、办公网络、监控网络和通讯网络为基础的网络架构已经形成,并且正在逐步完善网络架构的安全运维和优化建设。

智慧高速公路作为交通行业的新兴发展方向,集成了传感、通信、信息、云计算、大数据、人工智能和绿色能源等先进技术,正处在如火如荼地建设阶段。然而,如何在建设过程中感知各系统设备的运行效果、监测设备的故障?如何快速排障?如何进行备品配件调配?这些问题的解决将直接影响到智慧高速的建设成果。

第1章 智慧高速IT运维的痛点

随着高速公路建设的快速推进,我国大规模路网格局已基本形成,提升高速公路运维管理水平,发挥智慧高速联网设备整体性能,是高速公路运维管理面临的重要问题。在传统运维模式下,纵横交错的高速路网IT资源众多,存在诸多监控盲区、故障也无法被及时感知,整体运维工作存在大量难题。

面临的具体难题如下:

  • 海量的IT资源和庞大的运维范围,给设备管理、排障维护等运维工作带来压力,运维人员很难维护所有设施和各类业务应用。
  • 高速公路涉及传输设备、数通设备、安全设备、服务器、云、摄像头、感知终端等多种类型并存且相互连接,连接方式多样复杂,难以清晰管理设备间的链接关系。
  • 智慧高速运维中对视频设备的监控是重中之重。但视频设备散落分布,运维人员需要去往不同区域对设备进行维护,难以对全局摄像头进行实时监控。
  • 网络中出现故障或异常时,因网络结构复杂,设施异地等原因难以快速定位,又因设备品牌、型号、配置等存在差异,难以快速定位故障根因,造成排障困难。
  • 在运维过程中,只有当故障已经发生并且造成业务影响时才能发现和着手处理,日常运维工作多处于“救火”状态,被动地处理各种故障,效率极其低下。
  • 当网络环境故障发生后,没有全面的资产信息记录和维修职责任务分配,需要多方面协调,影响排障效率,对运维人员日常维护和定期检查,无法评估运维水平和工作效率。
  • 网络设备配置复杂,设备间兼容性差,运维过程中大量的配置变更和巡检工作以手工为主,效率低、风险大。
  • 高速公路的系统体系如MTC收费系统、ETC收费系统、电子监控系统、客流⻋道统计系统、信息发布系统等业务系统众多,业务系统间交叉联动,缺乏合理手段对业务进行全面监控。
  • 高速公路管理涉及的IT设备、业务软件、行政资产、备品备件等数量巨大,种类繁多,仅靠人工管理难以对其备件、配件信息详细统计工作力量巨大且极易出错,资产的采购、调拨、报废等管理效率低,难审计。

 

第2章 智慧高速全息感知运维方案

在传统运维方式下,智慧高速运维工作中,集中监控能力薄弱且依赖于经验和规则,运维工作开展的十分被动,解决问题的效率低下,运维的实用性大打折扣,难以满足当前主动运营的要求,因此必须借助一定的工具,对全部IT资源进行全量化的集中管理,实现网络态势实时感知和智能分析预测。

智慧高速运维需要从各个角度全息获取交通环境相关的IT设施信息,隧道内设备、道路监测设备、收费站及机房、ETC龙门架、服务区内等众多设备共同组成了信息化和数字交通的基础设施。北京智和信通智慧高速运维方案,通过智和网管平台对这些设备分布在高速公路的不同地域、线路、位置的基础设施进行统一纳管、统一监测。动态展现感知各种设备的分布情况、状态信息、异常情况等,并对其异常状态进行预警、处置。

智和信通高速公路一体化运维监控架构 

2.1.智慧收费站监控运维

在运维管理上,北京智和信通一体化运维监控方案将高速公路收费站网络中门架、机房设备状、园区等相关IT设施均纳入智和网管平台中一站管控,避免分散管理,减少运维成本。采取智能技术,实现网络拓扑可视化的能力,通过动态智能拓扑实现全量设备、资源、链接关系、IP等实时更新、快速定位。

智和高速收费站网络拓扑示意图 

2.2.智慧服务区监控运维

高速公路服务区作为高速公路的重要组成部分,能够为出行人员提供加油、如厕、餐饮等刚需服务,一直以来被认为是高速公路重要的延伸产业。而服务区的信息化建设也在经营管理和公众服务等层面发挥着越来越重要的作用。

智和高速服务区网络拓扑示意图 

方案中通过按片区、按地域、按层级等多种布局方式划分服务区网络,使用不同颜色、粗细、图标表示被管理对象的状态信息,助力运维人员实时了解网络架构及全网运行状态,快速感知资源、链路、流量等异常信息。同时采取分级、分权管理,不同人员对不同网络和界面具备差异化权限。

2.3.智慧道路视频监控运维

高速公路具有车流量大、车流速度快等特点,高速公路监控系统是保障高速公路被有效管理和维护的可靠手段,视频监控系统的稳定运行是对整条高速公路运营路况实时全面了解的有效手段,因此对视频监控系统内摄像头运行状态、画面质量的监测尤为重要。

视频监控效果示意图 

本方案支持对不同品牌、不同型号的摄像头进行统一运维,将网络高清、智能分析、多级管控融合为一体。通过网络拓扑一键自动发现生成能力,将视频监控体系涉及的视频前端设备,传输设备、内场设备、机房动环等设备,统一接入、集中管理,并自动生成拓扑图,通过定时轮询和事件上报进行可用性和健康度检查。

视频监控效果示意图 

2.4.全量资源统一监控

本方案实现网络设备信息高频采集,通过指标量化资源健康程度,并结合智能算法,实现对整体网络架构、设备运行状态、业务可用状态的实时信息采集和感知。

通过对智慧高速中道路情报板、隧道设备、道路监控设备、收费站及机房、ETC龙门架、服务区等相关的海量交换机、路由器、接入设备、无线AC、AP、摄像头、操作系统、应用、数据库、虚拟化、中间件、云、存储等设备智能解析和关联分析,助力运维人员从多个维度实现对相应告警的智能分析,解决传统运维监控中关联数据缺失,辅助排障信息不足的问题

2.5.端到端全链路可视化

方案通过对交换机光口和网络接口的监控,通过数据采集分析,实现对网络流量和关键连接的预测性维护,从整体维度到局部维度全面展示高速公路网络内IT设施间链路各项指标,整体可观测、可告警、可分析、可统计。

链路综合信息示意图 

2.6.弹性扩展,满足网络发展需求

方案支持设备及资源弹性伸缩,满足网络中设备量持续增长及更新的需求。通过自定义设备类型及其设备资源,最大限度上提高了智和网管平台的管理范围,真正实现了对设备及其资源的全面化管理,达到管控万物的目标。

2.7.运行性能态势分析

实时监测并感知网络性能相关情况,全面覆盖IT环境,采集设备资源、应用、服务等性能信息,通过智能分析,多维度处理、分析、展示网络基础设施性能状态,实现全网态势的“可观、可管、可控”。

2.8.故障态势感知

方案通过统一的故障管理平台,将各个模块中的监控信息统一采集、分析,实现整个高速公路网络中各种事件信息、设备故障、网络异常、流量异常等告警,以智能化手段进行标准化的分析、压缩、并归关联等,通过多种方式实时传达告警信息,保证落实到指定人员进行处理,为高速公路提供主动式的故障解决方案。

2.9.异常事件管理

将事件和告警分离管理,接收设备/服务器主动发送的消息,集中处理后,及时地通知用户,并可以通过集中的管理界面进行管理。接收设备/服务器主动发送的消息,极大地提高了管理的主动性,通过统一界面集中管理事件,降低了管理的难度。



2.10.跨地域自动巡检

传统的人工巡检,尤其是应用巡检,缺乏统一的规范、标准,导致巡检的范围和深度都存在一定的局限性,并且是基于人工的手工统计,工作效率比较低,同时耗费较大的人力资源。本方案依托平台将以前依赖手工进行的日常巡检转换为自动化、定时执行的巡检策略,日常例行巡检、节假日和重要事件前的巡检均可自动化执行。

2.11.全网带宽、流量趋势监测分析

随着高速公路信息化建设的加速,其业务、应用层出不穷,对网络带宽的需求越来越高。正常的业务需要良好的带宽环境保障机制,避免被一些与业务无关的杂事干扰,影响工作效率。方案对智慧高速路网络全局流量和带宽实时监控,将出入双方向流量情况可视化展现。

2.12.业务全景可视化观测

方案通过构建业务系统与部门、IT资源及关键指标的关联关系,整合前端、应用、后台任务、外部服务、数据库及基础设施,直观呈现面向服务的业务系统体系架构;通过影响传递,准确反映设备异常对核心业务、用户造成的影响和威胁,并对造成业务影响的故障进行实时告警,快速查明导致业务中断的故障源,帮助运维人员做出及时响应,保障业务连续性。

业务全景示意图 

2.13.业务可用性拨测分析

针对业务应用性能与用户体验进行检测分析,无需安装插件即可提供开箱即用的主动拨测试业务监测。从前端用户体验、网络延迟到后端业务服务和基础架构,全栈溯源为用户提供端到端完整全链路数据融合和关联分析,为用户快速发现业务性能瓶颈,提升用户体验奠定基础。

智慧高速业务看板示意图 

直观、便捷地帮助运维人员对智慧高速的ETC业务系统、车道收费系统、周界入侵检测系统、信息发布系统、特情处理系统、客流车道统计系统、稽查与信用管理系统等进行监控,掌握业务的运行状态和健康水平,了解业务动态变化趋势,快速定位故障源,降低运营风险。

2.14.全网IP合规监测

对于高速公路的IP资产,采取统一数据标准,对整体网络中的IP和MAC进行梳理和管理,建立健全IP资产台账,端到端规划、部署、管理和监控IP地址。通过多种合规性策略检测全网MAC-IP的使用情况,实现从规划、分配到使用、回收的IP地址全视角管理,提升IP信息准确性,真正IP地址集中化、自动化、规范化管控。

2.15.无人值守地设备远程配置

智慧高速网络承载的业务经常发生变更,面对业务的变更运维工程师往往要对大量设备进行操作,此时如果依靠工程师逐一登录设备进行命令下发、策略配置,将产生大量重复性的工作,不但导致运维效率低下,也不可避免地产生人为配置错误。

通过批量作业并行处理能力,实现多设备并发批处理操作,将简单的设备控制操作在大批量设备进行执行,并对执行过程进行监督,对执行结果进行检查。在安全合规的前提下,将运维人员从整体的变更流程及变更内容的准备中解脱出来,实现网络变更、设备配置自动化。

2.16.人工运维与故障自愈结合

将人工运维与故障自愈结合,无需针对告警进行手动处置,只需预编排告警处理流程,平台根据场景自动触发,实现故障自愈。

通过实时发现告警,进行预诊断分析,判断告警类型和级别,如果是一般告警,平台进行自动恢复,如果是严重复杂告警则通过告警通知、运维工单等形式通知运维管理人员,进行人工处理。同时,将只能由专家处理的各类操作和判断转化为可存在于平台内的流程,形成可保留可复用的运维知识。

2.17.运维大数据分析

智慧高速涉及的IT设施及各业务系统产生的海量数据无法得到深层次的应用,管理者决策缺乏数据依据,难以参考各类网络业务指标、数据等实现对运行态势、隐患风险的实时掌控及运营管理。

为解决此难题,智和信通高速公路监控运维方案利用图形、图表、图表等易于理解的形式,提取和分析大量复杂的各类运维数据,呈现分析结果,将全域资源融合展示。从而帮助运维人员在短时间内更好地理解和获得更多的信息,帮助运维中心能够实时了解业务和其所依赖IT资源的运行状况,以及提供系统运维和优化的指示和依据。

智慧高速运维大屏 

第3章 更多协同运维能力,保障智慧高速高效运维3.1.IT资产生命周期监管

对于资产管理,采取统一数据标准,对整体网络资产进行梳理和调用,避免资产信息在运维系统和实物间的差异,减少网络运维过程中信息不一致、数据不统一等问题通过平台将资产实物与运维数据库一一对应,解决网络设备在日常运维过程中出现“脱管”或“半脱管”的问题。

建立健全资产台账,实现一机一档,通过自定义多级资产分类,细化资产类别,实现资产分类管控,提高资产精细管理程度。从资产入库、领用、变更、维修、调拨、到报废处置,资产每一步操作均实现完整记录,支持追溯,通过平台实现资产整个生命周期的全流程闭环管理,使得IT资产每一次生命周期变更,都有流程可依、都有迹可循,从而实现全面的IT资产监管。

3.2.可量化运维工单体系

通过方案实现运维工单“无纸化”,支持于设备和故障管理页面快速创建工单,把控故障处理进度,通过工单平台简化故障处理流程,形成自动化故障处理机制,并在每个处理流程的节点上责任到人,实现在快速响应故障的同时,实现兼顾运维流程管控。

通过建立工单服务基准,预设工单在不同优先级、不同状态时,受理人应该响应的时间及未响应时的处理方式,生成工单自动化处理规则,并以多种方式进行通知,避免超时响应提升全流程服务管理质量。

第4章 智和信通信创国产化支持

方案涉及的所有产品与模块,均由北京智和信通自主研发,从功能模块、数据库、界面全部基于统一Java技术平台和统一数据关系模型,不包含任何第三方功能库。

智和信通提供的信创运维方案,立足于北京智和信通10年的国产融合经验,与国产软硬件产品深度适配,方案应用覆盖各行各业。方案支持在中标麒麟、银河麒麟、红旗Linux等国产操作系统上运行,支持在达梦、金仓、神州等国产数据库进行数据存储,通过东方通等国产中间件提供对外服务,支持龙芯、申威等国产CPU架构,并实现对国产化CPU、服务器、数据库、中间件等IT软硬件设备的综合监控与运维管理。

第5章 方案应用价值

智慧高速的发展极大地改善了道路监控能力,为实时路况监测、车流量统计以及施工防护等提供动态管理,有效地改善高速公路行车安全。但与此同时,飞速增长的海量IT设施给智慧高速运维工作带来了难题与挑战。

北京智和信通智慧高速全息感知运维方案的实施,实现高速网络体系中多类型、多品牌、多型号设施统一纳管、统一监测、实时预警、应急处置,高速公路系统故障信息的有效上传下达,各类故障问题及时上报。在实际运维工作中,排障、巡检过程高效进行,极大地提高运维效率,提升运维质量,降低运维成本。

第6章 标杆案例

至今,智和信通已成功在诸多高速公路进行部署与实施。通过“智和网管平台”实现智能化集中运维管理,对全部IT设施进行跨区域、跨平台、跨设备远程集中管控,智和信通高速公路一体化运维监控方案成果,其可靠性在智慧高速大规模、高复杂地网环境下得到了验证,并得到用户的充分认可

6.1.广深珠高速无线AP管理项目

广(州)—深(圳)—珠(海)高速公路横贯珠江三角洲。它东起深圳的皇岗,西至珠海的拱北,途经东莞、广州、佛山、江门、新会、中山等县市,总长302公里。面对长距离、跨地域的高速线路,整体网络和设备的管理成为广深珠高速公路有限公司亟待解决的难题。

6.1.1.核心需求

广深珠高速公司需要对广深珠高速上的网络设备进行集中监控管理,及时发现并解决设备故障,确保整个高速线路上的设备平稳运行。因此,其对这套整体网络监控系统以下核心需求:

  • 具备拓扑管理、链路管理的功能,实时显示设备拓扑图,在拓扑图上显示链路状态;
  • 拓扑图具有电子标签功能,可以对设备、资源等进行标记;
  • 具备告警管理,性能管理,配置文件管理,日志管理等功能;
  • 网管系统能兼容多种品牌;
  • 对AP设备进行直接管理,实现管理AP设备的详细参数。

 

6.1.2.智和信通建设方案与效果

经过全面的沟通和调试,智和网管平台通过对成品软件的配置,实现了客户的核心需求。同时,因采用成品软件+扩展的模式,免除了进行二次开发的难题,为客户节省了大量的时间和成本。

  • 平台支持CDP、LLDP、ARP邻居路由等物理拓扑发现技术自动识别链路,生成拓扑,并在拓扑中以不同颜色设备图标实时展现设备的实时状态信息,通过拓扑图对设备、设备资源、链路进行管理;
  • 支持对设备进行自定义标签和命名,便利用户对设备进行区分和管理;
  • 支持多种告警机制,自定义配置告警阈值,支持快速标示已经执行操作的告警,迅速定位告警设备;
  • 多维度管理设备资源、应用、服务等性能信息;
  • 全面支持华为、华三、思科、中兴、摩托罗拉AP等设备类型,实现多品牌设备统一管理;
  • 对摩托罗拉AP设备实现直接管理,达到监控射频口、网口、端口状态、带宽流量、AC参数等。

智和网管平台的成品软件+扩展的模式,实现了对摩托罗拉AP的直接管理,将AP设备作为单独的设备,享受与常规设备一样的拓扑、设备管理、资源、告警、性能、事件、报表、统计分析等全面功能。既实现了广深珠高速的管理需求,又免除了进行二次开发的难题,为客户节省了大量的时间和成本。

标签:运维,管理,高速公路,全息,监控,高速,感知,设备
From: https://www.cnblogs.com/zhtelecom/p/17680546.html

相关文章

  • 系统-部署-运维系列导航
    系统环境Linux软件环境初始化(CentOS)LinuxDNS配置手册LinuxWindows常用命令Linux分区、LVM、文件系统(CentOS7)LinuxNTP时钟同步Linux开发小工具Python-3.10.5学习笔记银河麒麟操作系统 部署运维组件安装部署手册模板Linux僵尸进程与孤儿进程Linux服务进程守......
  • LSS(Lift,Splat,Shoot)-实现BEV感知的最佳利器
    整个模型的作用,就是将单个摄像头2维的信息先lift到3维,然后再将多个摄像头3维的信息进行splat(拼接)。然后再去对历史轨迹进行shoot,预测主车未来的行驶轨迹。从二维转到三维需要满足一下三个性质:1.转换完之后障碍物的性质是不会改变的;2.和camera的顺序无关;3.和camera所处位置无......
  • Linux运维工程师面试题(6)
    Linux运维工程师面试题(6)祝各位小伙伴们早日找到自己心仪的工作。持续学习才不会被淘汰。地球不爆炸,我们不放假。机会总是留给有有准备的人的。加油,打工人!1数据库事务的四个特性及含义数据库事务的4个特性:原⼦性、持久性、⼀致性、隔离性原⼦性:整个事务中的所有操作要么......
  • accesskey_tools阿里云运维工具:自动化运维的利器
    一、简介:accesskey_tools是一款强大的云计算运维工具,它为云计算环境提供了自动化运维的解决方案。本文将为您介绍accesskey_tools的功能和用途,重点关注其自动创建ECS服务器、批量执行命令以及执行计划任务命令等自动化运维特性。二、优点:在不登录云平台的情况下,通过AccessKeyID和A......
  • MySQL MGR集群部署运维常用脚本
    Linux系统-部署-运维系列导航 安装、初始化操作汇总注意:Pass.Test.123替换为真实的root账号密码,Repl.pass.123替换为真实的mgr集群创建时group_replication_recovery通道的密码 #初始化、重置mysqlrm-rf/data/mysql/;mkdir-p/data/mysql/data/data/mysql/log;......
  • SpringBoot--运维实用
    SpringBoot运维实用篇打包与运行windows打包在maven中双击package打包另外如果打包报utf-8的错,在pom中添加<plugin><groupId>org.apache.maven.plugins</groupId><artifactId>maven-resources-plugin</artifactId><version>2.6</version>&l......
  • 【ceph运维】解决mon is allowing insecure global_id reclaim问题
    解决monisallowinginsecureglobal_idreclaim问题1.查询ceph状态:$ceph-scluster:id:37ac4cbb-a2c6-4f81-af1e-e9e39c010c85health:HEALTH_WARNmonisallowinginsecureglobal_idreclaimservices:mon:1daemons,quorumcep......
  • Kubernetes运维-Pod调试
    调试pod最简单的方法是在有问题的pod中执行命令,并尝试排除故障。这种方法很简单,但有许多缺点。正在运行的应用pod可能没有排除现有问题所需的所有工具。如果想执行一些需要额外权限的操作,需要重新启动应用pod,以添加新的权限。在docker镜像中添加调试工具会引入安全风险,提升容器权限......
  • 工业物联网解决方案:起重机运维可视化管理平台
    起重机在建筑工地、矿山、铁路、码头等场景都有应用,在货物装卸、搬运作业中扮演着重要角色。由于起重机操作复杂和受现场环境影响大等问题,往往可能出现安全隐患,对现场工作和人员安全造成威胁。为保证起重机的安全稳定运行,运维可视化管理平台应运而生。数之能提供的起重机运维可视化......
  • Oracle - 运维相关总结
    读写分离读写分离的重点其实就是数据同步,能实现数据实时同步的技术很多。基于日志的Oracle复制技术,Oracle自身组件可以实现,同时也有成熟的商业软件。选商业的独立产品还是Oracle自身的组件功能,这取决于多方面的因素。比如团队的相应技术运维能力、项目投入成本、业务系统的负......