首页 > 其他分享 >ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?

时间:2022-11-24 18:32:26浏览次数:43  
标签:步骤 用户 时序 根因 故障 访问量 链路 2.0

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务

近年来,随着数字化转型的不断推进,电子商务发展迅速,推动人们的购物行为随之发生转变,在线购物已成为人们的主要购物方式之一。相关数据表明,超过九成的中国网民使用过在线购物平台。

面对庞大的在线用户流量,购物网站的业务规模和复杂程度不断提升,维护系统稳定性的重要程度和难度也随之增大。当故障问题产生时,如何直观地还原故障传导链路,快速定位和解决问题,就成为了重中之重。

Bonree ONE 2.0设计的初衷,便是将所有运维诉求“ALL in ONE”,让IT运营更智能、让业务创新更高效、让问题解决更快速。对于客户来说,开箱即用、操作便捷,使用第一个功能可以解决的问题就不需要再点击第二个功能。

四大场景提升网站应用性能与用户体验

一、用户登录网站购物时遇到问题,如何进行故障定位

Bonree One 2.0可深度还原故障场景,并将其转化为为IT语言,通过查看前端问题,关联整体调用链,展示调用链树和代码,快速定位故障,找到缓慢代码,助力快速解决问题。

操作步骤

步骤一:该购物网站登录、搜索产品、选择产品、付费、登出的全过程;

步骤二:在Bonree ONE 2.0平台中找到该次用户会话,还原使用过程,查看后端缓慢问题;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_02

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_访问量_03

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_04

步骤三:跳转到调用链,展示调用链树,展示调用架构,找到缓慢的代码调用的耗时分析、错误、日志等;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_05

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_06

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_访问量_07

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_08

步骤四:通过端到端的能力,反向查找用户会话。

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_访问量_09

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_10

二、主动模拟故障发生场景,进行智能告警与根因分析

Bonree ONE 2.0的智能告警可以做到真正意义上告知用户问题及根因,同时依赖独家根因智能算法和模型,不依赖人工调参,无监督自动学习;也可接受人工结果反馈,自动修正模型提高结果准确性,实现低成本、高灵活度、高准确性的智能根因分析能力。

操作步骤

步骤一:在故障中找到智能根因分析产生的告警信息,展示告警信息的内容;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_11

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_12

步骤二:展示根因分析结果,与模拟的故障相符;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_13

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_14

步骤三:通过根因回放,呈现故障产生的过程。

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_访问量_15

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_16

三、用户访问量下降,监测后端服务响应时间是否异常

面对用户访问量下降、访问异常等情况,Bonree ONE 2.0可对后端服务响应时间进行监测,以此诊断系统是否存在故障,助力快速排障。

操作步骤

步骤一:查看过去一段时间的用户访问量,并做同期对比,发现访问量下降;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_17

步骤二:分析用户访问量下降的原因,同时发现用户访问缓慢;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_访问量_18

步骤三:利用数据分析模块,将与用户访问量相关的指标(如后端服务响应时间等)进行对比分析,发现随着服务响应时间变长,用户访问量下降;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_19

步骤四:点击服务响应时间峰值点,查看相关调用链,发现数据库该时间段访问缓慢,查找数据访问缓慢原因,如某项SQL语句逻辑有问题;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_访问量_20

步骤五、问题解决后,用户访问量恢复。

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_21

四、监控面板功能与流程

操作步骤

步骤一:通过仪表盘,展示关键指标,以及仪表盘的筛选、刷新、轮播等功能;

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_22

步骤二:仪表盘出现告警的处理流程,如关联用户会话、调用链,进行诊断。

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_23

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_响应时间_24

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_25

ONE 2.0应用场景解读 | 如何通过时序拓扑直观还原故障传导链路?_后端服务_26

Bonree ONE 2.0凭借稳健的技术底盘和强大的中台能力,支撑了多个应用场景,不仅覆盖了 IT运维监控,还做到了向左支持敏捷开发,向右支撑业务运营,形成了真正的一体化智能可观测平台。

标签:步骤,用户,时序,根因,故障,访问量,链路,2.0
From: https://blog.51cto.com/u_15292091/5884462

相关文章