首页 > 其他分享 >分布式数据中心节点多?看托管云如何实现精细运维​

分布式数据中心节点多?看托管云如何实现精细运维​

时间:2022-10-25 18:36:12浏览次数:53  
标签:数据中心 运维 网络 基线 链路 告警 分布式


分布式数据中心节点多?看托管云如何实现精细运维​_链路


随着用户数据中心节点的增多,在管理数据中心上,网络突然中断、流量高并发、网络配置异常、网口硬件异常等问题时有发生。依靠人工手动进行网络质量及故障分析,并根据经验进行故障处置的传统运维方式,无法全面覆盖数据中心出现的问题。​

为此,信服云托管云研发了网络全链路质量感知与分析系统。​

该系统能够综合运营商、物理网络、主机网络、VPC网络等多层网络视角,为运维使用者提供一套全链路网络质量感知及智能分析解决方案 有效提升告警质量和告警后排障效率。 

分布式数据中心节点多?看托管云如何实现精细运维​_数据_02

↑ 网络全链路分析处置系统能力​


网络链路主动拨测

可以优化监测分析及可视结构,并基于上下游关联告警自动挖掘和聚合方法聚合缩减非必要的监测告警,分钟级发现网络通断及卡慢,在大量告警中快速定位到根因,为IaaS管理员快速梳理机房和各租户的网络连通性状态,为租户快速梳理其虚拟机内部的网络状态报告。

分布式数据中心节点多?看托管云如何实现精细运维​_链路_03


分布式数据中心节点多?看托管云如何实现精细运维​_链路_04

↑ 提供全部探测及分析结果的详情​

分布式数据中心节点多?看托管云如何实现精细运维​_链路_05


↑ 提供虚拟机内部端到端TCP/UDP通信对的网络质量可视与分析​


基于RTT时延动态基线的风险预测

基于RTT时延动态基线进行风险预测,支持智能基线的自动学习,通过对正常状态下指标的历史表现,加以调整后作为基准线,与以后同样时段的实时指标做对比,能根据历史记录自动生成基线,并可按照业务周期潮汐变化规律,形成以日基线、周基线的数据对比,一旦实时数据大于基线比对的一定范围,即生成告警事件,成功预测风险。

分布式数据中心节点多?看托管云如何实现精细运维​_数据_06


↑ 变化趋势预测​

同时,该系统还会不断进化,未来可以实现虚拟机内部的应用网络质量和平台IaaS层的一体化联动多模态分析,实现更快的故障定界。​

基于全量指标构建实体资源图谱体系,IT运维人员在排障时,也可通过关联分析在5分钟内定位到虚拟机内部、外部故障根因和处置建议,且能利用知识图谱直观掌握平台健康状态和故障影响面大小。​

在网络资源配置推荐上,可以全面监控虚拟网络拓扑、配置、流量、数据面状态等数据,利用多种机器学习方法实现准确的数据面性能压力估计。基于数据面性能压力及网络流量历史趋势,关联预测数据面性能极限出现时间点并推荐最优数据面资源配置。​

以上就是关于信服云托管云上网络全链路质量感知与分析系统的介绍,该系统可以帮助用户降低网络故障率,实现数据中心的省心运维。


标签:数据中心,运维,网络,基线,链路,告警,分布式
From: https://blog.51cto.com/u_15583138/5795032

相关文章

  • 墨天轮沙龙 | SphereEx代野:Apache ShardingSphere-从中间件到分布式生态演进之路
    在9月22日举办的【墨天轮数据库沙龙第十期—国产中间件专场】中,SphereEx解决方案专家代野分享了ApacheShardingSphere:从中间件到分布式生态演进之路》主题演讲,本文为整......
  • Paxos分布式系统共识算法?我愿称其为点歌算法…
    原创:微信公众号码农参上,欢迎分享,转载请保留出处。哈喽大家好啊,我是Hydra。分布式系统共识算法Paxos相信大家都不陌生,它被称为最难理解的算法不是没有道理的,首先,它的发......
  • LAXCUS分布式操作系统正式开源!
    Laxcus分布式操作系统和源程序代码,此前一直在专业领域传播,随着Laxcus分布式操作系统应用部署到各个行业,用户规模越来越多,开放共享的声音越来越大,所以产品团队决定:Laxcus分布......
  • Mysql运维-数据库及表相关操作
    微信公众号:IT邦德一.创建和删除数据库1、MySQL8.0之前默认的数据库字符集是latin1,从8.0开始,默认就是utf8mb4字符集。2、utf8mb4可以存储表情等特殊字符,MySQL......
  • 使用Docker进行Jmeter分布式压测
      一、概述单个 JMeter 实例可能无法产生足够的负载来对应用程序进行压力测试,就如jmeter[官网所示][https://jmeter.apache.org/usermanual/remote-test.html],一......
  • Selenium4Web自动化11-分布式测试Grid入门到实战
    一、Grid介绍要在多台计算机上并行运行测试吗?那么,Grid正是为你准备的.SeleniumGrid允许通过路由命令在远程机器上执行WebDriver脚本,这些命令由客户机发送到远程浏览......
  • 分布式协调服务的存在意义
    分布式协调服务是分布式应用中不可缺少的,通常担任协调者的角色,比如leader选举、负载均衡、服务发现、分布式队列和分布式锁等,这里以leader选举和负载均衡为例,说明分布式协调......
  • 图解 Redis 分布式锁,写得太好了!
    分布式锁的演进基本原理我们可以同时去一个地方“占坑”,如果占到,就执行逻辑。否则就必须等待,直到释放锁。“占坑”可以去redis,可以去数据库,可以去任何大家都能访问的地......
  • 浅谈基于无线物联网技术的分布式配电室远程监控系统研究
    陈盼安科瑞电气股份有限公司上海嘉定201801 摘要:为解决现有配电室监控系统在实际应用中存在配电室各监控参数采集结果误差较大问题,设计一种新的监控系统,实验证明能够有效......
  • Envoy 分布式追踪
    追踪概述分布式跟踪允许开发人员在大型面向服务的架构中获得调用流的可视化。它对于理解序列化、并行性和延迟来源非常重要。Envoy支持与系统范围跟踪相关的三个功能:请求I......