首页 > 其他分享 >微服务监控实战(一):监控概览

微服务监控实战(一):监控概览

时间:2024-09-26 14:51:57浏览次数:10  
标签:实战 请求 概览 指标 监控 链路 日志 数据

如果你觉得这篇文章对你有帮助,请不要吝惜你的“关注”、“点赞”、“评价”,我们可以进一步讨论实现方案和细节。你的支持永远是我前进的动力~~~

灵魂拷问

  1. 服务之间的依赖关系?
  2. 服务的资源使用情况?
  3. 每天的业务高峰期是哪个时间段?
  4. 每天发生多少次异常?
  5. 有多少次是在收到业务反馈之前知道出问题了?
  6. 排查一次问题需要多少时长?
  7. 我们有哪些工具可以用于问题定位?

快请监控来帮忙吧!!!

监控分类

监控分类

日志、指标及链路追踪的关系

Metrics 的特点是,它是可累加的:他们具有原子性,每个都是一个逻辑计量单元,或者一个时间段内的柱状图。 例如:队列的当前深度可以被定义为一个计量单元,在写入或读取时被更新统计; 输入 HTTP 请求的数量可以被定义为一个计数器,用于简单累加; 请求的执行时间可以被定义为一个柱状图,在指定时间片上更新和统计汇总。

Logging 的特点是,它描述一些离散的(不连续的)事件。 例如:应用通过一个滚动的文件输出 Debug 或 Error 信息,并通过日志收集系统,存储到 Elasticsearch 中; 审批明细信息通过 Kafka,存储到数据库(BigTable)中; 又或者,特定请求的元数据信息,从服务请求中剥离出来,发送给一个异常收集服务,如 NewRelic。

Tracing 的最大特点就是,它在单次请求的范围内,处理信息。 任何的数据、元数据信息都被绑定到系统中的单个事务上。 例如:一次调用远程服务的 RPC 执行过程;一次实际的 SQL 查询语句;一次 HTTP 请求的业务性 ID。

多维度比较

初始成本: CapEx, the initial cost to start instrumenting and collecting the signals;

持续投入成本: OpEx, the ongoing cost to run the supporting infrastructure;

反映灵敏度: Reaction, how good the system is at detecting and alerting on incidents;

对问题定位的帮助程度: Investigation, how much the system can help to triage and debug incidents

适用场景

不同的监控用于不同的场景

  1. 日志、链路、指标数据用于调试、定位问题
  2. 健康监控、指标数据用于监控告警

当然也不是绝对的,如也可以通过日志、链路的数据进行分析告警

监控分层

监控要从多个层次去做,否则会发现一堆报警,但查不出原因的尴尬处境

  1. 端用户监控:主要从端上采集性能、返回码、app版本、系统、运营商等数据,分析用户访问分布、端到服务器的延时等。
  2. 业务监控:定义业务的核心指标,如登录、注册、下单、支付等,可以分析访问频率、流量规律等。
  3. 应用层监控:qps、rt、慢请求、缓存命中率,cpu、内存、磁盘使用率等
  4. 中间件监控:网关、缓存、MQ、DB等中间件的相关指标
  5. 基础设施监控:如网络、交换机、丢包率、连接数、cpu、内存、磁盘等,这项监控通常由运维负责,基本上都是标配,不会遗漏
  6. 数据核对:数据一致性、正确性,资金对账等。指标数据都很好,但是数据错了,这才是真要命呢!!!

总结

监控数据有多种,每种有其不同的使用场景,解决不同的问题

完美的监控要从多方面、多层次、全方位考虑

当这些数据都有了,结合起来就具有了可观测性

持续优化系统,系统就可以朝着稳定、高性能的方向发展起来了

标签:实战,请求,概览,指标,监控,链路,日志,数据
From: https://blog.csdn.net/u013469646/article/details/142482474

相关文章

  • Linux系统之温度监控工具——lm_sensors的安装和基本使用
    Linux系统之温度监控工具——lm_sensors的安装和基本使用一、lm_sensors介绍lm_sensors,是一款基于linux系统的硬件监控的软件。可以监控主板,CPU的工作电压,温度等数据。rpm包下载地址获取码2344:lm_sensors-3.4.0-6.20160601gitf9185e5.el7.x86_64.rpm二、检测安装环境1.检查......
  • JavaScript数组方法实战:12个实用技巧让你轻松处理数组
    ......
  • prometheus学习笔记之基于三方exporter实现监控
    一、redis_exporter通过redis_exporter监控redis服务状态git地址:https://github.com/oliver006/redis_exporterdocker地址:https://hub.docker.com/r/oliver006/redis_exporter实验环境:redisk8部署prometheus二进制部署1.redis_exporter使用简解二进制部署prometheus配置方式......
  • 实战教程!Zabbix 监控 Spark 中间件配置教程
    本文将介绍以JMX方式监控Spark中间件。JMX具有跨平台、灵活性强、监控能力强、易于集成与扩展、图形化界面支持以及安全性与可配置性等多方面的优势,是监控Spark等复杂Java应用程序的重要工具之一。ApacheSpark是一个开源的大数据处理框架,它提供了快速、通用和可扩展的数据处理......
  • 如何选择靠谱的视频监控联网平台?看完这篇你就懂了!
    在大型连锁企业的广泛布局中,跨地域的多点监控系统面临着集中管理的挑战。视频联网技术的引入,如同编织了一张智能监控网络,使分散在各处的监控资源得以无缝对接,实现一体化管控。这一技术不仅简化了管理流程,还通过与业务系统的深度融合,赋予监控系统智能分析等能力,为智慧化应用场景奠......
  • Cisco ASAv 9.22.1 发布,新增功能概览
    CiscoASAv9.22.1-思科自适应安全虚拟设备(ASAv)CiscoAdaptiveSecurityVirtualAppliance(ASAv)请访问原文链接:https://sysin.org/blog/cisco-asav/,查看最新版。原创作品,转载请保留出处。作者主页:sysin.org思科自适应安全虚拟设备(ASAv):新增功能重要说明ASA9.......
  • 自然语言处理实战项目java环境案例
    自然语言处理(NLP)是计算机科学和人工智能的一个重要分支,旨在实现计算机对人类语言的理解、处理和生成。随着深度学习和机器学习的进步,NLP应用在语音助手、文本分析、情感分析、机器翻译等方面得到了广泛应用。在Java中,虽然相比Python来说,NLP的生态系统并不算完善,但仍然有许多库......
  • R语言实战——数据整理、可视化、建模与挖掘(文末赠书)
    R语言是源代码开放、功能强大的数据分析软件,它在数据清洗与探索、数据分析与建模、数据可视化、机器学习、深度学习等方面具有优秀的表现,广泛应用于数学、统计学、数据科学、计算机科学、人工智能、云计算、生物医学、工业统计等方向,发展前景十分广阔。《R语言实战——数据整理、可......
  • 【c++实战项目】从零实现一个高并发内存池
    主页:醋溜马桶圈-CSDN博客专栏:实战项目_醋溜马桶圈的博客-CSDN博客gitee:mnxcc(mnxcc)-Gitee.com目录1.项目介绍1.1 这个项目做的是什么?1.2这个项目的要求的知识储备和难度?2.什么是内存池2.1 池化技术2.2 内存池2.3 内存池主要解决的问题2.4malloc3.开胃......
  • SSM项目实战II基于SSM的培训机构运营系统(开发文档+数据库+源码)
    目录一、前言二、技术介绍三、系统实现四、论文参考五、核心代码六、源码获取全栈码农以及毕业设计实战开发,CSDN平台Java领域新星创作者一、前言随着知识经济的兴起,教育培训行业迎来了前所未有的发展机遇。传统培训机构在追求教学质量的同时,也面临着运营管理效率提......