首页 > 其他分享 >优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?

时间:2023-08-11 18:05:50浏览次数:30  
标签:采集 指标 关键字 监控 日志 中捞 告警 优维

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志采集

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志监控_02

日志记录了软件系统的生命线,为我们提供了故障排查和性能优化的关键线索。

本期EasyOps产品使用最佳实践,我们将为您揭晓:

  • 如何监控日志的关键字?
  • 如何基于关键字告警?

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_软件系统_03

日 志 关 键 字 监 控

日志作为软件系统运行时记录,记录了软件运行生命周期的事件,因此日志监控在监控实践中属于非常关键的一项。

在日志监控中,我们可能会有这样的需求:

  • 针对某个特殊的关键字做监控,关注关键字出现的次数,希望知道在什么时刻,关注的关键字是多少。如下图所示:

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志采集_04

  • 当在周期内出现关键字的次数大于多少次时,希望引起重视,比如下面的告警告诉我1888@ not found这个关键字在一个采集周期内,已经出现了52次。

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志监控_05

结合以上信息,很可能代表软件系统的功能发生了故障。

那么该怎么满足上述的监控效果?下面的文档,演示了如何基于平台,实现对关键字的采集和监控,并且基于关键字出现的次数进行告警。

配 置 说 明

1.新建日志采集任务

选择右上角的新建日志采集并提取关键字加工为指标,注意,这里分为两种类型的指标:

  • 关键字加工指标:可通过从日志数据提取关键字,并加工为指标对系统进行实时监控,提升系统健康的感知能力。
  • 通用指标:通用指标包含各种由日志内容分割出来的指标。

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志监控_06

选择监控的资源对象

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志监控_07

选择日志标记

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志监控_08

点击下一步后,选择要监控的关键字

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志监控_09

此处会新建一个指标:keepalive_timeout_count。

注意:

  • 这个指标会从日志内容中,匹配包含err:keepalive timeout的关键字,如果匹配,则指标数加1。
  • 日志汇聚频率是15s采集一次,也就是说,如果配置出现次数的阈值是10,那么,在15秒内这个采集周期中,出现10次关键字后,即可触发告警。

最后点击保存。

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志监控_10

稍等片刻后,即可看到指标的数据。也就是我们开头提到的图:

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志采集_11

2.配置告警规则

① 新增监控目标, 这个目标一般是主机,也可以关联具体的部署实例。具体根据上面的配置采集策略时关联的模型而定。在此处,则是一台主机:

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志采集_12

② 添加告警条件,这里针对新建的指标,在采集周期内出现超过10次即告警。具体次数可根据您的实际场景而定:

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志采集_13

③ 后续根据实际情况添加到告警通知组。

此时,当监控的日志出现关键字,超过10次后,即可触发告警通知。

优维产品最佳实践第4期:如何在海量日志中捞到你要的关键字?_日志采集_14

附上告警通知模板:

{% set color = "red" %}

{{time|ts2str:'%Y-%m-%d %H:%M'}} 产生告警事件</font></h2>

| 事件类型 | 日志监控 |

| --- | --- |

| 告警等级 | {{levelName}} |

| 告警资源 | {{t*****}} |

| 告警信息 | {{originContent}} |

| 运营负责人 |{{instance|jsonpath:'$.owner[*].name'|unique|join:','}} |

| 持续时长 | {{duration|duration_format:'zh'}} |

| 首次发生时间 | {{startTime|ts2str:'%Y-%m-%d %H:%M'}} |

| 事件详情 | [请点击](http://*****.*******.*****/next/events/{{eventId}}/detail) |

| 策略详情 | [请点击](http://*****.*******.*****/next/events/alert-rule/alert-rule/{{ruleId}}/edit) |

标签:采集,指标,关键字,监控,日志,中捞,告警,优维
From: https://blog.51cto.com/u_15605878/7050520

相关文章

  • Nginx日志分析- AWK命令快速分析日志--封禁访问请求最多、最频繁的恶意ip
    Nginx日志常用分析命令示范(注:日志的格式不同,awk取的项不同。下面命令针对上面日志格式执行)1.分析日志的方法1)总请求数cd/usr/local/nginx/logs/wc-laccess.log|awk'{print$1}'166252)独立IP数awk'{print$1}'access.log|sort|uniq|wc-l4003)每秒客户端......
  • 使用awk分析nginx访问日志access.log
    1.awk简介awk是一种编程语言,用于在linux/unix下对文本和数据进行处理。数据可以来自标准输入、一个或多个文件,或其它命令的输出。它支持用户自定义函数和动态正则表达式等先进功能,是linux/unix下的一个强大编程工具。它在命令行中使用,但更多是作为脚本来使用。awk的处理文本和数......
  • 使用Spring Cloud Sleuth实现分布式跟踪与日志追踪
    在复杂的微服务架构中,跨多个服务的请求可能会变得难以调试和追踪。SpringCloudSleuth是一个用于实现分布式跟踪和日志追踪的解决方案,它可以帮助开发人员跟踪请求的流转路径,定位问题,并进行性能分析。本文将深入探讨如何使用SpringCloudSleuth来实现分布式跟踪与日志追踪,并提供代......
  • 神通数据库根据归档日志恢复数据
    1、执行这个sql语句;CREATETABLET_TMPASSELECTversions_xidXID,versions_startscnSTART_SCN,versions_starttimeSTART_TIME,versions_endscnEND_SCN,versions_endtimeEND_TIME,versions_operationOPERATION,IDFROMTJ_ARCH_GC.T_AR_FPDA_FILEVERSIONSBETWEEN......
  • 为什么要建物化视图日志
    本文转载自:https://so66.cn/66787.html 建立物化视图日志:提高数据库性能的必要手段当今,数据已成为企业发展的重要资产,而数据库则是数据管理的核心。与此同时,随着业务量越来越大,数据库性能问题也变得越来越突出。在这种情况下,物化视图日志成为了对数据库优化的一种必要手段。......
  • ELKF日志系统搭建(单机8.9版)
    一、ELKF简介ElasticSearch:搜索、分析和存储数据Logstash:采集日志、格式化、过滤数据(数据清洗的过程),最后将数据推送到Elasticsearch存储Kibana:数据可视化Beats:集合了多种单一用途数据采集器,用于实现从边缘机器向Logstash和Elasticsearch发送数据,使用最多的是Filebeat,是一个轻量级......
  • 为ping添加时间戳后台运行实时输出保存日志
    前言ping命令是一种比较好用的网络诊断工具,常用来验证链路问题,例如pingtraceroutemtr都使用的“ICMP”包来测试Internet两点之间的网络连接状况。生产环境中,网络是否稳定(网络时延)是一个很重要的指标.为了方便检查网络时延的大小,我们可以通过ping命令实现长时间的......
  • AD360在网络安全和日志审计中的重要作用
    随着数字化时代的来临,网络已经成为了人们生活和工作中不可或缺的一部分。然而,随之而来的是网络安全问题日益突出。为了应对这些安全威胁,护网行动应运而生,其中AD360在保障网络安全方面扮演着至关重要的角色。 AD360是一个集成的解决方案,能够帮助企业高效地管理和保护其IT基础设......
  • docker日志存储限制
    新建/etc/docker/daemon.json,若有就不用新建了。添加log-dirver和log-opts参数,样例如下:#vim/etc/docker/daemon.json{"data-root":"/opt/docker","insecure-registries":["http://10.168.1.130:5000"],"log-driver":......
  • 6.Filebeat的安装及收集日志到Elasticsearch并使用自定义索引
    利用Filebeat收集日志Filebeat是用于转发和集中日志数据的轻量级传送程序.作为服务器上的代理安装,Filebeat监视指定的日志文件或位置,收集日志事件,并将它们转发到Elasticsearch或Logstash进行索引.Logstash也可以直接收集日志,但需要安装JDK并且会占用至少500M以上的内存生产......