首页 > 其他分享 >监控系统企业架构演进史-拨测监控

监控系统企业架构演进史-拨测监控

时间:2024-01-10 21:33:02浏览次数:37  
标签:架构 演进 系统 探针 拨测 监控 告警

前情概述:

在《监控系统企业架构演进史-跨地域混合云》中,监控系统已经逐步成熟且企业化发展。 这一章节简单讲述一下期间的拨测能力搭建,以下是这套系统的发展史,在监控平台搭建的过程中,内部监控采集还不足以满足企业业务需求,在计划发展apm之前,异地拨测的黑匣子监控也纳入了该系统的一个子功能。

监控系统企业架构演进史-拨测监控_监控系统

拨测监控架构的实现

系统搭建⾯临需解决的问题:

  • ⻓期以来企业在公⽹监控,乃⾄⽤⼾侧最后⼀公⾥的监控都存在空洞,导致⽤⼾侧的业务故障问题 企业都没有及时发现,需要⽤⼾报障我们才后知后觉的排查问题。⿊匣⼦拨测监控系统项⽬的上线 就是解决了这⻓期以来的监控痛点。
  • ⿊盒监控 即以⽤⼾的⾝份测试服务的外部可⻅性,常⻅的 ⿊盒监控 包括 HTTP探针 、 TCP探针 等⽤于检测 站点或者服务的可访问性 ,以及 访问效率 等。⽽探针的设计需要⽀持对业务的交互 才能更有效的发现问题。所以在探针⼯具选型中选择了 Prometheus + blackbox_exporter 来实现需求。
  • 拨测点需要在全国各地布点,在管理上难度较⼤,特别在兼顾拨测任务分发、拨测监控数据回收统 ⼀展⽰、告警聚合收敛的同时,还要考虑安全和应对审计等问题。架构的设计上需要严格控制 PULL和PUSH的数据流,还要和现有的采集监控系统独⽴出来。所以引⼊了Mosn做⽹格管理来降 低管理成本。
  • 该系统的数据展⽰上默认只能⽤时序图和表格来展⽰现状,⼀个很直⽩的地域图更能说明问题。为 了做地域图的展⽰,还引进了 geohash + OpenStreetMap 来解决。

需求与功能

第一期的建设只是基本要求,但是需满足以下条件以达成业务基本需求:

  • ⽀持对公司前端服务的证书链,DNS耗时,TLS耗时,⾸次建⽴建⽴耗时,加载完成耗时等监控
  • ⽀持ICMP拨测,可对⽣产业务系统的跨域内外⽹的⽹络质量监控,特别是跨域专线质量的监 控。
  • ⽀持DNS,TLS tcp,SMTP协议等交互监控。均⽀持在CDN服务场景,Proxy服务基础场景,邮 箱系统的使⽤场景。

同时,因为项目的0-1阶段基本都很难得到企业的深度投入,在第一期的建设也只能依赖开源项目搭建,后续逐步投入组件二开的研发资源以实现能力扩展。

架构简要

首先,定义每个拨测点为边缘孤岛,这里的边缘孤岛是因为它部署的地理位置远离企业系统的机房,分别在世界各地购买一些最便宜的虚拟机资源来部署服务,且代表当地发起拨测的请求。 利⽤了 geohash + OpenStreetMap 在告警和图展⽰中凸显了地域质量数据。

监控系统企业架构演进史-拨测监控_监控系统_02

每个孤岛拨测节点需要具备基础⾃治能⼒,包括 ⾃⾝状态监控 , 拨测任务的发起 , ⾃⾝告警策。以下是拨测节点的内部结构,该结构在cpu为0.5core,内存为512M就足够运行,后期还可以通过二开组件的方式进一步整合资源的利用。

监控系统企业架构演进史-拨测监控_监控系统_03

效果展示

拨测全局概览视图

监控系统企业架构演进史-拨测监控_监控系统_04

拨测资源使用情况

监控系统企业架构演进史-拨测监控_监控系统_05

告警展示

监控系统企业架构演进史-拨测监控_监控系统_06

标签:架构,演进,系统,探针,拨测,监控,告警
From: https://blog.51cto.com/mickeyzzc/9185843

相关文章

  • 智能分析网关V4方案:太阳能+4G+AI识别搭建智慧果园/种植园远程视频监控监管方案
    一、方案背景我国是水果生产大国,果园种植面积大、产量高。由于果园的位置大都相对偏远、面积较大、看守人员较少,值守的工作人员无法顾及园区每个角落,果园财产安全成为了关注的重点。人为偷盗、野生生物偷吃等事件时有发生,并且受极端天气如狂风、雷暴、骤雨等影响,果树木和灌木类也......
  • 安防视频监控平台EasyCVR使用RTMP推流但是通道显示不在线的原因排查
    安防视频监控平台EasyCVR采用了开放式的网络结构,支持高清视频的接入和传输、分发,平台提供实时远程视频监控、视频录像、录像回放与存储、告警、语音对讲、云台控制、平台级联、磁盘阵列存储、视频集中存储、云存储等丰富的视频能力,此外,国标GB28181高清可视化视频监控云平台EasyCVR......
  • SD-WAN网关监控异地组网
    SD-WAN网关监控异地组网是指利用SD-WAN网关对远程网络设备进行监控与管理,确保网络连接的稳定性与安全性。这种智能网络设备支持多种连接方式(比如MPLS、互联网或无线网络),能够智能地选择最佳网络连接路径,以确保异地组网的稳定性与可靠性。它监控与管理远程网络设备状态与性能,提供各种......
  • 域智盾软件是电脑监控软件它都能做什么?
    域智盾软件:是保障企业网络安全的重要工具。在当今社会,网络安全问题日益凸显,众多安全问题不断困扰着企业等社会群体组织,作为企业网络安全的守护者,有着10年研发的域智盾软件可以保障局域网安全,为大家排忧解难。下面我将将详细介绍域智盾软件从它的特点、功能、优势以及应用场景。......
  • zabbix 6.2监控系统
    https://zabbix.com/documentation/current/en/manual/installation/containers1.Zabbixserver2.Zabbixwebinterface3.Zabbixproxy4.ZabbixJavagateway5.ZabbixWebService6.ZabbixSnmptraps7.Zabbixagent2......
  • Zabbix5.0监控Redis6.0实录
    Zabbix5.0监控Redis6.0实录1.环境描述ZabbixServer:5.0.12Redis:6.2.6(集群,有密码)操作系统:Centos72.监控步骤(1)通过yum安装zabbix-agent2#yum-yinstallzabbix-agent2这里安装的zabbix-agent2也是5.0版本。(2)配置zabbix-agent2配置文件,我的配置文件如下......
  • cfs文件系统只读监控
    一、需求有重要文件存放在cfs文件系统(CloudFileStorage),该文件丢失对业务有严重影响,为确保文件系统可用性,防止出现只读、挂载失败等异常,现对改文件系统进行监控。二、监控原理每分钟往cfs文件系统写入文件,文件名依据当前分钟动态生成,文件格式为"2023-12-08_16:35"。监控对象为该文......
  • 监控易:独立而又耦合的产品模块,实现个性化运维需求
        监控易是一款高效、可靠的IT监控管理平台,旨在帮助企业实现对IT设备的全面监控和管理。    监控易产品模块包括视图、告警中心、设备管理、业务管理、网络管理、日志管理、机房动环、资产管理、运维管理、统计报告、智能工具、云平台和智能预测管理。    ......
  • Prometheus+Grafana:转转如何打造开箱即用的一体化监控系统?
    一分钟精华速览面对业务侧和架构侧的双重“降本+提效”需求,转转结合自家业务的特性进行二次开发,构建出一套集业务服务、架构中间件、运维资源于一体的立体式监控平台。转转借此平台实现了对于各业务线的全方位监控和报警。在构建这个监控系统的过程中,转转围绕简化链路、权限与看......
  • Zabbix6.x监控SSL证书到期时间
    前言随着公司项目不断增多,随之开发使用的系统也越来越多,需要对域名SSL证书进行监控,以防止服务不可用。环境准备服务器:centos7.9安装依赖:yuminstallbcgccgcc-c++openssl-yzabbix:6.x脚本准备出于安全策略,服务并没有开放443端口,因此需要2个参数:域名和端口号#!/bin/shhost=......