首页 > 其他分享 >无需重启应用,动态采集任意点位日志

无需重启应用,动态采集任意点位日志

时间:2022-11-18 18:28:03浏览次数:85  
标签:无需 java log 重启 我们 采集 日志 mse

作者: 屿山

现实系统往往有着较高的复杂度,我们借助 Trace、Log、Metric 三驾马车使我们的系统具备了一定的可观测性,但观测位置和信息往往是固定的,而我们所遇到的问题常常是意料之外的,这就导致我们能够定位问题的范围,但是难以更进一步,这时候我们就需要在我们想要的位置采集信息来帮助我们,在通常的实践中这就意味着我们需要添加日志逻辑并重启应用,这种做法成本较高而且会丢失现场。而借助日志治理,只需要通过在控制台配置规则便可以在不重启应用的前提下,动态采集任意点位信息。接下来通过一个假想的排查流程来简单介绍下日志治理的实践。

动态日志打印

假设我们有一条如图所示的简单的请求数据库的请求调用链路,当该调用链路的请求出现了异常,在定位问题的过程中,我们往往会需要知道调用的堆栈信息,进而去排查堆栈上的方法,获取这些方法的参数、返回值、异常等信息,从而帮助我们查清问题的原因。借助日志治理的能力,我们可以很方便地进行这些操作。

1.png

在这个场景下,当发现 AppB 的/sql 请求部分报错,但我们并没有预先编写能够记录有效信息的日志,这时我们就可以通过配置一条日志治理的规则来打印现场的堆栈信息,以获取我们需要排查的方法列表,再进一步对逐个方法进行分析。我们选择/sql 作为 Target,如果不知道具体的接口,也可以保持默认选择全部。

2.png

由于我们只需要分析错误的请求,所以在过滤规则条件中开启异常过滤,在打印内容中选中调用堆栈,其他的内容可以根据需要选择。

3.png

4.png

开启该规则后,可以看到系统帮助我们在日志文件中打印了包含堆栈信息的日志:

/home/admin/.opt/ArmsAgent/logs/mse-log-governance.log

at com.mysql.cj.jdbc.ClientPreparedStatement.executeQuery(ClientPreparedStatement.java:989)
  at com.alibaba.druid.pool.DruidPooledPreparedStatement.executeQuery(DruidPooledPreparedStatement.java:213)
  at com.alibabacloud.mse.demo.service.DruidCon.doCommond(DruidCon.java:57)
  at com.alibabacloud.mse.demo.service.DruidService.query(DruidService.java:15)
  at com.alibabacloud.mse.demo.BApplication$AController.sql(BApplication.java:89)
  at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method)
  at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62)
  at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)

截取其中一部分可以发现其中有一部分是我们自身的业务逻辑方法,也是我们需要关注的方法,我们可以继续借助日志治理的能力,去获取这些方法的现场信息,比如参数、返回值、类加载器等等。

自身业务逻辑方法:
com.alibabacloud.mse.demo.service.DruidCon.doCommondcom.alibabacloud.mse.demo.service.DruidService.query

以 doCommond 方法为例,我们只需要增加一条新的规则,指定该自定义方法。

7.png

随后在过滤规则条件中开启异常过滤,在打印内容中选中请求参数,其他的内容可以根据需要选择。

8.png

开启该规则后,可以看到系统帮助我们在打印了 JSON 格式的日志信息,包含了我们所勾选的参数信息:

/home/admin/.opt/ArmsAgent/logs/mse-log-governance.log

{
  "appName": "app-b",
  "attributes": {
    "mse.tag": "base",
    "mse.param": "{"sql":"select * from log_demo where id = ?","id":"1"}",
    "mse.app.tag": "base",
    "mse.service.type": "CUSTOM"
  },
  "endTime": 1665974434728,
  "events": {},
  "ip": "10.0.0.166",
  "name": "com.alibabacloud.mse.demo.service.DruidCon:doCommond(java.lang.String,int)",
  "needRecord": true,
  "parentId": -4669550334584716586,
  "ruleIdSet": [
    288
  ],
  "spanId": -8047278153886744300,
  "startTime": 1665974434725,
  "statusCode": 2,
  "traceId": "ea1a00009d16659744347231724d0001"
}

以上只是简单的例子,但是能够由此发现,日志治理的能力能够让我们在 Java 方法任意点位收集信息,将排查工作变成零代码且动态的,由于不需要在测试环境中重复增加日志代码并不断重启应用,能够大大减小某些难以在测试环境中复现的问题的排查难度。

日志采集

在启用了日志治理功能之后,我们的日志会被自动滚动保存至本地,为了满足存储或是进一步分析的需求,我们可以将这些日志采集到日志服务系统中。这里以 SLS 的 Logtail 采集方式为例。

配置 Logtail 采集日志

在通过组件或是其他方式在我们的集群或是实例中安装了 Logtail 之后,可以通过日志服务 SLS 控制台来完成日志采集的配置,这部分内容可以详见 SLS 日志服务的相关文档。我们只关注其中的一些配置,首先是 Logtail 配置,在 K8s 集群场景下,我们所需要的配置如下:

  • 日志路径为:/home/admin/.opt/ArmsAgent/logs/mse-log-governance.log

使用 OneAgent 时,日志路径为:

/home/admin/.opt/ArmsAgent/plugins/ArmsAgent/logs/mse-log-governance.log

9.png

  • 打开是否为 Docker 文件的开关
  • 打开是否部署于 K8s 的开关
  • 模式选择 JSON 模式

其次是查询分析配置,在控制台配置流程中,我们可以选择自动生成索引或是后续在 SLS 控制台中自行增加索引,为了方便我们的分析,statusCode、ruleIdSet、name、appName 等字段建议增加索引。

查看日志

稍等片刻后便可以在 SLS 控制台查看收集的日志,并借助查询分析功能处理日志。

10.png

小结

借助日志治理的现有能力,我们能够在不重启应用的前提下,动态采集任意点位信息,同时由于日志治理在采集信息时会引入链路信息,在分析复杂调用问题时能够起到很好的效果。目前日志治理采集的信息会以 JSON 格式的形式滚动存储在本地,我们可以借助 SLS 这类日志服务系统提供的采集方法采集并进行进一步的查询和分析,后续日志治理也会不断完善优化,采集的信息组织完全兼容 OpenTelemetry 标准,并进一步提供完善的符合标准的上报方式。

MSE 云原生网关预付费、MSE 注册配置预付费首购 8 折,首购 1 年及以上 7 折。点击此处,即享优惠!

标签:无需,java,log,重启,我们,采集,日志,mse
From: https://www.cnblogs.com/alisystemsoftware/p/16904148.html

相关文章

  • Spring Boot集成日志框架
    日志框架一、日志的作用日志(Log)的作用:开发调试:在开发过程中,进行逻辑跟踪、查看运行结果问题排查:辅助排查和定位线上问题,优化程序运行性能状态监控:监控系统的运行......
  • tomcat日志类别
    日志类别服务器⽇志catalina.out HTTP访问⽇志localhost_access_log.${date}.txtWeb应⽤⽇志localhost.${date}.log管理日志manage.log日志的级别......
  • [C++]-日志记录库SPDLog简介[通俗易懂]
    文章目录spdlog库日志记录槽sink日志记录器logger输出格式pattern对齐方式截断字符串格式化fmtFormatSpecificationspdlog使用异常处理logger基......
  • python-日志详解
    一.logging模块_打印以及保存日志1、Logging:用来做简单的日志。等级分为debug()、info()、warning()、error()和critical()等级 使用场景DEBUG 调试......
  • 日志系统
    日志1、Log简介logging模块是Python内置的标准模块,主要用于输出运行日志,可以设置输出日志的等级、日志保存路径、日志文件回滚等;相比print,具备如下优点:通过log的分析,可......
  • Kubernetes日志采集Sidecar模式介绍
    摘要:DaemonSet和Sidecar模式各有优缺点,目前没有哪种方式可以适用于所有场景。因此我们阿里云日志服务同时支持了DaemonSet以及Sidecar两种方式,并对每种方式进行了一些额外......
  • “一站式”家校服务系统---开发日志1
    一、虚拟机搭建(CentOS)1、自行下载安装VirtualBox。visualBox进行安装需要cpu开启虚拟化,在开机启动的时候设置主板,CPUconfiguration,然后点击IntelVitualizationTec......
  • centos7 php 服务重启
    apache服务启动systemctlstarthttpd停止systemctlstophttpd重启systemctlrestarthttpdmysql服务启动systemctlstartmysqld停止systemctlstopmysq......
  • 【Logback+Spring-Aop】实现全面生态化的全链路日志追踪系统服务插件「Logback-MDC篇
    日志追踪日志追踪对于功能问题的排查和数据流转的路径分析时非常重要的,有了全链路日志追踪体系机制可以非常有效且快速的定位问题,但在多线程环境中,若没有相关成熟的框架的支......
  • 09_Kafka入门_数据日志分离
    关闭kafka但是会有延时,关闭的比较慢。之后再看一下就没了,需要等待一下。我们删除每台机器的logs文件夹:我们希望把数据和logs分开来放。这时候,就相当于kafka新装的一样......