首页 > 其他分享 >摒弃“短板”——数据中心基础设施运维管理建议书

摒弃“短板”——数据中心基础设施运维管理建议书

时间:2022-10-26 17:35:08浏览次数:64  
标签:数据中心 运维 管理 端口 线缆 短板 设备

数据中心是数字基础设施的重要组成部分,同时也是一整套复杂的设施。它不仅仅包括计算机系统和其它与之配套的设备(例如通信和存储系统),还包含冗余的数据通信连接、环境控制系统、监控系统以及各种安全系统。运维管理又是数据中心在运营过程中历时最长的一个阶段。如何确保数据中心安全、可靠、高效的运行则是运维人员工作内容的重中之重。

摒弃“短板”——数据中心基础设施运维管理建议书_网络拓扑

在数据中心网络运维管理过程中,运维人员要对数据中心的网络构成、业务走向、设备相互连接关系等做充分的了解。据了解,现有的管理方式大多是将数据中心初建阶段的数据通过表格、图纸、文档等方式整理好,然后在以此为基础作为后续的变更规划,排障宝典。然而,事与愿违,实际工作中总会有不同的原因促使实施人员不按规范操作、数据变更不及时,重要文件丢失等,当遇到突发业务故障,手忙脚乱,翻遍表格、图纸,耗时耗力不说还影响客户对运维工作的满意度。

那么,既然现有管理方式并不是那么的有效,是否可以借助一些运维管理工具来完善我们的基础设施运维工作呢?

据了解,目前用于数据中心运维管理的工具有动环系统、监控系统、网管系统以及3D可视化系统,然而各个平台都是独立的,甚至不同品牌设备的管理系统也是独立的,运维人员日常维护需要登录多个系统,并且在其间来回切换。除此以外,以上都是针对有源设备开发的管理系统,然而往往造成系统故障的原因可能只是运维人员不小心碰掉了某根光跳线。可见仅仅只是管理硬件并不能解决根本问题。

“一只木桶盛水的多少,并不取决于桶壁上最高的那块木块,而恰恰取决于桶壁上最短的那块。”由此看来,高性能的设备可能会扩大计算、存储、分析以及灾备等能力,然而一根线缆的故障却能使其前功尽弃。由此可见,庞大的线缆管理难题始终都是数据中心运维管理这个木桶中最短的那块木块。

摒弃“短板”——数据中心基础设施运维管理建议书_网络拓扑_02

结合以上,小编认为有效的基础数据及线缆管理结合现有的有源设备管理系统,通过数据互通,相互补充汇总、进而分析报告,才能完善现有运维管理方式,使运维管理系统成为运维人员的股肱心腹。

一、基础数据管理

基础数据包括:地理位置、园区范围、建筑外观、楼层机房数量、机房内部设备位置、机柜类型、机柜U位、设备外观、设备板卡、设备/板卡端口、线缆等。

管理方式:运用地图、图纸、图片等素材以层次化的方式建立图形可视化的网络基础设施数据库。

摒弃“短板”——数据中心基础设施运维管理建议书_数据中心DCIM_03

管理内容:地理位置、外观、名称编码、品牌、类型、数量、占用情况、线缆连接关系、端口流量、维护人员等等相关需要记录、管理的信息。

实现方法:可根据情况选择手动创建或通过插件使用Excel/WPS批量导入创建。

实现效果:

  • 快速查询定位设备、板卡、端口、线路
  • 室外网络基础设施快速查询定位
  • 光纤状态显示与业务定义查
  • 前端点位—可视化定位查
  • 电力连接可视化查询
  • 设备文档关联查询
  • 对端分析—快速查看机柜内设备间连接
  • 链路分析—自动生成物理链路
  • 拓扑分析—自动生成物理拓扑
  • 路由分析—动态跟踪线缆桥架
  • 机房容量分析
  • 自定义多维度分析报表

二、线缆管理

  • 自动推荐链路
    新增设备时,系统可根据预设的设备模型端口类型及端口标准,自动推荐可以使用的线缆类型。
  • 自动线缆长度测量
    创建线缆连接的同时自动测量出两台设备之间应使用的线缆长度。
    规划人员无需经过繁琐的审批手续进行现场勘察工作,就可以获得较准确的线缆长度,规划的同时,即可定制出较准确的材料清单。
  • 自动生成标签编码打印
    系统每一根新增的线缆都可按照预设的标签规则(TIA 606B标准或用户自定义),自动生成标签编码,通过API接口实现编码列表自动传递至标签打印软件,运维人员可按需打印标签使用。
    众所周知,运维工作中标签的工作量巨大,人工编制百密一疏在所难免,有了这个功能运维人员即可从繁杂的标签工作中解脱出来,有效避免错误的同时,极大的提高了工作效率。
  • 自动生成任务工单
    对于规划新增的线缆,系统会自动生成工单任务,可以根据实际需要批量发送给实施人员。
    两台设备之间用什么样的线缆,长度多少,数量多少,起始端口,终止端口一目了然,工单任务清晰直观。实施工作也相对简单许多,无需反复沟通确认,只需在完工后拍照反馈即可。
  • 线路路由查询
    通过线缆可查找这根线缆连接的本端设备端口与对端设备端口。
    通过端口我们可以了解这条链路所承载的业务方向,端口通过SNMP协议可实现故障报警、流量监测等功能,当该业务终端出现故障时,可快速排查故障点,提高除障效率。

三、与有源设备管理系统结合

摒弃“短板”——数据中心基础设施运维管理建议书_运维_04

  • 开放的RESTful API,方便第三方系统导入和查询数据。
  • 基于AMQP的消息总线,实时发送资源变化消息至第三方系统。
  • 实时采集开启SNMP协议设备的数据。
  • 能够从系统内部启动外部应用程序和脚本。
  • 能够与IT服务管理ITSM、流程、网管、监控等系统快速集成。

通过与第三方系统对接,运维管理人员可以全方位的了解整个数据中心基础设施的运行状态,快速处理日常业务需求及故障排除工作。

摒弃“短板”——数据中心基础设施运维管理建议书_运维_05

数据中心基础设施运维工作道阻且长,为响应国家号召“加快数字化发展,建设数字中国”。我们运维管理人员也要时刻保持创新,不能让“短板”拖累了我们紧随时代发展的步伐。

文:孟敏




标签:数据中心,运维,管理,端口,线缆,短板,设备
From: https://blog.51cto.com/u_14982569/5798112

相关文章

  • linux运维管理常用指令
    发布时间  2022-10-26:15:37接上节<5分钟快速搭建nodejsweb应用>,我们部署完web应用后,就会遇到一些维护问题,比如外网无法访问,比如我们要重启,结束进程等等,本节重点列举几......
  • Linux运维比较常用的一些脚本
    注意:根据不同系统的版本可能有些脚本的命令不是这样子使用,请悉知!!!根据PID过滤进程所有信息#!/bin/bash#Function:根据用户输入的PID,过滤出该PID所有的信息read-p"请......
  • 分布式数据中心节点多?看托管云如何实现精细运维​
    随着用户数据中心节点的增多,在管理数据中心上,网络突然中断、流量高并发、网络配置异常、网口硬件异常等问题时有发生。依靠人工手动进行网络质量及故障分析,并根据经验进行故......
  • Mysql运维-数据库及表相关操作
    微信公众号:IT邦德一.创建和删除数据库1、MySQL8.0之前默认的数据库字符集是latin1,从8.0开始,默认就是utf8mb4字符集。2、utf8mb4可以存储表情等特殊字符,MySQL......
  • VMware vRealize Orchestrator 8.10 - 数据中心工作流自动化平台
    请访问原文链接:https://sysin.cn/blog/vmware-vro-8/,查看最新版。原创作品,转载请保留出处。作者主页:www.sysin.org什么是vRealizeOrchestrator?vRealizeOrchestrator......
  • Centos7对外开放端口 | 运维 | Linux
    概要本篇文章记录Centos7下查看防火墙状态和网络状态命令firewal相关操作查看对外开放的端口状态查询已开放的端口$netstat-anp查询指定端口是否已开$firewall-......
  • Thanos 架构剖析(四)数据存储和运维工具
    ThanosStore主要提供查询历史数据功能,当Querier组件调用Stroe接口,Stroe再通过对象存储接口获取数据,并将存储数据转换成Querier所需的数据格式。Thanos数据存储Thanos......
  • 智能化运维场景分析
    传统的系统运维是一项存在大量重复和复杂、烦琐的工作,靠的是运维人员的人海战术,每个人或每个小组负责一块,等待预警和报障,被动处理。尽管系统运维技术在不断进步,但实现上IT运......
  • 07 Ceph 集群运维
    目录Ceph守护服务管理全局管理一台机器有多个ceph服务STARTINGALLdaemonsSTOPPINGALLdaemons服务分类管理STARTINGALLDAEMONSBYTYPESTOPPINGALLDAEMONSBYTY......
  • 【运维这些事儿】- 网络文件系统之NFS
    NFS是一种分布式文件系统,通过网络可以将不同操作系统的文件共享。其通信协议定基于TCP/IP协议层,将远程的计算机磁盘挂载到本地,读写文件跟本地磁盘一样。NFS简介NFS服务在......