首页 > 其他分享 >优维产品最佳实践第17期:善用控制台

优维产品最佳实践第17期:善用控制台

时间:2023-12-04 18:00:36浏览次数:36  
标签:状态 17 主机 集群 监控 组件 控制台 优维 页面

优维产品最佳实践第17期:善用控制台_高负载

优维产品最佳实践第17期:善用控制台_高负载_02

「 背 景 」

遇到页面报错时,是不是感到困扰,不知如何解决?

页面响应缓慢时,是否感到迷茫,不清楚从何入手排查?

面对主机高负载时,是不是觉得确认异常根因很有挑战?

本期最佳实践为您讲解如何通过控制台排查定位:

  1. 页面报错时,获取traceId确认报错组件;通过全局监控确认组件状态,查看组件日志分析原因。
  2. 页面响应缓慢时,查看集群主机状态并通过链路跟踪发现耗时最长的节点,进一步查看组件状态、日志,优化解决。
  3. 主机高负载时,通过主机上的CPU使用、内存使用Top10进程来定位,找到占用资源最高的进程,抓取堆栈信息进行分析。

「 全 局 监 控 」

优维产品最佳实践第17期:善用控制台_进程名_03

平台监控包括四个模块: 全局监控、存储组件监控、逻辑组件监控、监控流监控

「 主 机 监 控 

默认首页为主机监控,在这个界面我们可以看到这个集群的整体情况,集群中各主机的状态。集群状态的判断为各主机心跳状态+ 时间偏移+磁盘使用率低于90,这3个指标都正常的时候集群状态才为正常。图一跟图二的对比可以看出来,当磁盘使用率降到90以下后集群状态才回归正常。

优维产品最佳实践第17期:善用控制台_高负载_04

接下来的部分是常用指标的折线图,最长保留60天的数据,可以通过调整右上角的时间范围来看长时间的趋势。

优维产品最佳实践第17期:善用控制台_折线图_05

主机资源不足的情况下,我们常常会去找占用资源最多的进程。控制台同样集成这样的能力,我们可以按主机、CPU、内存、进程名来过滤,定位进程的资源使用情况。这里记录的是某个时刻的Top10进程,如果进程没有进到前10,则会搜索不到。

优维产品最佳实践第17期:善用控制台_高负载_06

优维产品最佳实践第17期:善用控制台_高负载_07

「 组 件 状 态 

组件状态主要展示集群组件的运行状态,按组件类型分tab展示:后台组件、资源包(以-M、-db、-R结尾的组件)、前端插件(以NA、NB结尾的组件)

优维产品最佳实践第17期:善用控制台_高负载_08

该页面提供过滤、查询等功能,当我们已知组件部分信息时,这个功能能帮助我们确认组件部署所在的主机、组件监听的端口、名字服务以及状态。如果组件状态为异常,点击组件名可以查看详细信息。如果为下线组件,可以标记忽略,避免误报。

优维产品最佳实践第17期:善用控制台_高负载_09

标签:状态,17,主机,集群,监控,组件,控制台,优维,页面
From: https://blog.51cto.com/u_15605878/8680624

相关文章

  • Day17 异常与日志
    1.异常的概述在编程中,我们经常遇到各种不可预见的问题,例如:文件找不到、网络连接失败、数组越界等。这些问题我们通常称之为“异常”(Exception)。java把异常当作对象来处理,并定义了一个基类java.lang.Throwable作为所有异常的超类。java.lang.Throwable主要分为两类错误Error......
  • IDEA2023只能创建jdk17和21的springboot项目解决
    现象:解决:将serverurl修改即可https://start.spring.io--》https://start.aliyun.com可以对比下内容修改成功后就可以创建低版本jdk的springboot项目了......
  • SP1716 GSS3 - Can you answer these queries III 题解
    题意:给定一个长度为$n$的序列$a$,$q$次操作,每次操作为以下之一:\(0\)\(x\)\(y\):将\(a_x\)修改为\(y\)\(1\)\(l\)\(r\):询问区间\([l,r]\)的最大连续子序列和思路:考虑线段树维护区间最大连续子序列和:线段树每个节点需要维护的信息:区间左端点$l$,区......
  • [Codeforces] CF1733C Parity Shuffle Sorting
    题面翻译给定一个长度为\(n\)的数组,你可以对它进行不超过\(n\)次操作。对于每次操作:选择两个下标\(l,r\),满足\(1\leql<r\leqn\);若\(a_l+a_r\)为奇数,将\(a_r\)赋值为\(a_l\),否则将\(a_l\)赋值为\(a_r\)。求一种方案,使得操作后的数组单调不减(即\(a_1\leq......
  • 学期2023-2024-1学号20232417《网络》第4周学习总结
    教材内容总结通过这一章的学习,我了解了系统安全的发展历史、系统安全相关内容的概念以及系统建设的相关事宜,主要包括系统建设的基本原则、着手方式、事前预防、事后补救和保障措施等方面。教材学习中的问题及解决过程问题:在学习了课本内容后对访问控制策略还是不太清楚解决......
  • Day17 包机制
    包机制包的本质就是文件夹一般利用公司域名倒置作为包名;​如com.baidu.www包语句的语法格式为:packagepkg1[.pkg2[.pkg3...]];​为了能够使用某一个包的成员,我们需要在Java程序中明确导入该包。使用"import"语句可完成此功能importpackage1[.package2........
  • 2023-2024-1 20231417 《计算机基础与程序设计》第十周学习总结
    2023-2024-120231417《计算机基础与程序设计》第十周学习总结作业信息这个作业属于哪个课程2023-2024-1-计算机基础与程序设计这个作业要求在哪里2023-2024-1计算机基础与程序设计第十周作业这个作业的目标自学计算机科学概论第12,13,14章,《C语言程序设计》第9章......
  • 多媒体应用设计师 第17章 多媒体应用场景的技术应用和实现示例
    口诀【虚入手跟交立眼】(虚拟现实系统的输入设备:数据手套、三维位置跟踪器、三维空间交互球、立体眼镜)**【虚出视听触】【视头洞响墙】【听耳喇】【触触力】**虚拟现实系统的输出设备:视觉感知设备(头盔式显示器、洞穴式立体显示装置、响应工作台显示装置、墙式投影......
  • 17、Flink 之Table API: Table API 支持的操作(2)
    文章目录Flink系列文章一、TableAPI介绍6、表的union、unionall、intersect、intersectall、minus、minusall和in的操作7、表的OrderBy,Offset和Fetch操作8、表的insert操作9、GroupWindows1)、Tumble(TumblingWindows)2)、Slide(SlidingWindows)3)、Session(SessionWind......
  • 2023-2024-1 20231317 《计算机基础与程序设计》第十周学习总结
    作业信息这个作业属于哪个课程<班级的链接>(如2023-2024-1-计算机基础与程序设计)这个作业要求在哪里<作业要求的链接>(如2023-2024-1计算机基础与程序设计第十周作业)这个作业的目标<《C语言程序设计第9章》《计算机科学概论第12、13、14章》>作业正文https://w......