首页 > 其他分享 >TuGraph Analytics作业监控面板:运行时组件上的高效分析工具

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具

时间:2024-01-05 19:33:12浏览次数:38  
标签:Pipeline 作业 Analytics TuGraph 组件 master 日志 页面

作者:丁一


背景

TuGraph Analytics作业部署到K8S集群之后,通常会启动多个pod(一个master、一/多个driver、多个container)。用户很难判断作业当前运行的进度如何,也不能通过pod的状态来判断内部进程的状态。无论是查看进度、查看日志、性能分析,都需要到每一个pod中进行对应的操作,运维成本很大,需要一个白屏化的监控页面来监控所有进程的实时状态信息。

因此,我们在作业进程中内置了一个Dashboard(本地启动/容器启动时自动生效),包括前端页面和后端server,用户可以不需要感知到它们的存在。通过访问Dashboard,用户可以更方便地通过白屏化的方式查看作业的执行进度、组件列表和详情、任意组件内部的指标、日志等。还可以通过Profiler工具对进程状态进行分析,快速定位问题。

Dashboard介绍

TuGraph Analytics的Dashboard模块提供了作业级别的监控页面,可以轻松地查看作业的以下信息:

  • 作业的健康度(Container和Worker活跃度)
  • 作业的进度(Pipeline和Cycle信息)
  • 作业各个组件的实时日志
  • 作业各个组件的进程指标
  • 作业各个组件的火焰图
  • 作业各个组件的Thread Dump

如何访问页面

页面的服务部署在master组件上,因此直接访问master组件的地址即可(默认端口8090)。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式

功能介绍

TuGraph Analytics Dashboard包含以下几个主要的功能:

Overview

Overview页面会展示整个作业的健康状态。你可以在这里查看container和driver是否都在正常运行。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_图计算_02

除此之外,Overview页面也会展示作业的Pipeline列表。

作业执行计划进度

作业的执行计划可以由多个Pipeline表示,每个Pipeline内部又有多个Cycle。 可以通过侧边栏的Pipeline菜单进入页面。页面包括作业的每一项Pipeline的名称、开始时间和耗时。 耗时为0表示该Pipeline已开始执行,但尚未完成。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式_03

点击Pipeline名称可以进入二级菜单,查看当前Pipeline下所有的Cycle列表的各项信息。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式_04

作业组件详情

可以查看作业的各个组件(包括master、driver、container)的各项信息。可以通过侧边栏的菜单进行访问。 其中Driver详情展示所有driver的基础信息。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_监控_05

Container详情展示所有Container的基础信息。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_图计算_06

组件运行时详情

通过点击左边栏的Master详情,或者通过点击Driver/Container详情中的组件名称,可以跳转到组件的运行时页面。在运行时页面中,可以查看和操作以下内容。

进程指标

展示完整的容器进程指标。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式_07

容器日志

展示容器进程内的主要可见日志。 根据日志的log4j配置,默认日志文件大小最大为128G(此处测试简单起见设置为了50KB),超过后会进行文件备份。例如master.log.1和master.log.2就是master.log的备份之一。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式_08

  • master.log:Master的java主进程日志。
  • master.log.1 / master.log.2:Master的java主进程日志备份。
  • agent.log:Master的agent服务日志。
  • geaflow.log:进入容器后的shell启动脚本日志。

点击任意一个日志可以进入日志详情页面。日志的获取进行了后端分页,可以在右下角选择每页的KB大小,并可以跳转到指定页数。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_图计算_09

火焰图

展示火焰图的历史执行结果,并可重新生成新的火焰图。火焰图分析类型可选择CPU或ALLOC,单次最多分析60秒,最多保留10份历史记录。 点击“新建”,即可生成新的火焰图。

  • 火焰图类型:可选CPU或者ALLOC(Memory)。
  • 执行时间:分析时间,需介于1~60秒之间。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式_10

火焰图的执行时间根据用户的选择可能较久,因此会在后台静默执行。需要等待执行结束后,手动点击“新建”按钮旁边的“刷新”标识,获取最新的火焰图历史。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式_11

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_图计算_12

Thread Dump

展示主进程的Thread Dump结果,并可重新进行Dump。保留最新一次dump的结果。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_监控_13

点击“重新执行”,等待执行结束后,结果会自动刷新。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_图计算_14

进程配置

展示master的java主进程内的各项配置(仅master拥有此页面)。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_图计算_15

其他用法

列表排序与查询

部分列表的列可以进行排序和查询。 查询时,点击“搜索”标识,输入关键字,点击“搜索”按钮即可。 重置时,点击“重置”按钮,列表会重新刷新。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式_16

国际化

页面支持中英文切换,点击右上角的“文A”图标,即可选择语言。

TuGraph Analytics作业监控面板:运行时组件上的高效分析工具_分布式_17

欢迎关注我们的GitHub仓库: https://github.com/TuGraph-family/tugraph-analytics

标签:Pipeline,作业,Analytics,TuGraph,组件,master,日志,页面
From: https://blog.51cto.com/u_16180133/9117014

相关文章

  • Linux核心组件(CPU,内存,磁盘,网络,进程)
    一、CPU不同组件,每秒的运算、读写次数命令集:lscpu+top/htop/uptime+mpstat+sar#查看CPU静态信息cat/proc/cpuinfo#查看CPU统计信息lscpu uptimeLoadAverage(平均负载):就是一段时间内(1分钟、5分钟、15分钟)内平均Load翻译:一段时间内正在使用和等待使用CPU的平均进程......
  • SCA面面观 | 企业该如何选择组件检测工具?
    一般来说,一个软件应用程序可以被分解成若干部分,为软件程序解耦,以减少整个应用程序的复杂性,这些部分就是软件组件。以一种标准化的方式相互作用,使得组件可以像机器的“零部件”一样被换入或换出,因组件具有独立性、可重用行、高内聚、低耦合等优势,可以帮助企业提高开发效率和质量,减少......
  • vue---v-modle实现字符组件通信
    子父组件在做数据传值和通信中,通常都是父组件通过【:props】进行数据的传递,通常用于父组件通过传递不同的参数,改变子组件。但是经常会遇到这样的场景:需要父子组件进行数据通信,实现双向数据绑定,可以利用v-modle实现父子组件数据交互通信。父组件:<template><div>......
  • Vue2 中每个组件实例都对应一个 watcher 实例?.
    Vue2中每个组件实例对应一个渲染Watcher实例,用于监听组件的响应式数据变化并更新视图。除了渲染Watcher,还可以通过watch属性来创建额外的Watcher实例,用于监听特定的数据变化。在Vue2中,每个组件实例都有一个$watch方法,可以用于创建Watcher实例。......
  • 如何管理多个React组件的异步请求
    如何管理多个React组件的异步请求一、异步请求的背景前端应用中的异步请求前端应用中的异步请求是指在前端开发中,通过使用Ajax、fetch或其他网络请求库,向后端服务器发送请求并获取数据的过程。由于前端开发中常常需要实现多个React组件之间的数据交互,因此对于异步请求的管理变得尤......
  • openGauss学习笔记-186 openGauss 数据库运维-升级-集群管理组件增量升级
    openGauss学习笔记-186openGauss数据库运维-升级-集群管理组件增量升级本章介绍版本集群管理组件增量升级方法。186.1操作步骤集群管理组件升级前准备与检查集群管理组件升级集群管理组件升级后检查集群管理组件增量升级注意事项:集群管理组件增量升级操作不能和扩节......
  • 华为下“加单令”,大举扫货CIS等关键零组件 | 百能云芯
    近期,华为冲刺折叠手机火力全开,通过向供应链发出大规模的“加单令”,旨在本年度将折叠手机的出货目标提升至千万级别,几乎是去年的三倍。为实现这一目标,华为专注于大规模采购关键零部件,尤其是CMOS影像感测器(CIS)等关键组件,以确保生产线的持续稳定运作。先前有消息传出,华为有意下修今年......
  • VUE框架CLI组件化配置Router使用params传递参数机制解析------VUE框架
    <template><div><!--组件分为普通组件和路由组件--><divclass="s1"><h2>市区</h2><ul><!--写死信息方式传递--><!--<li><router-......
  • html5实现文件批量上传组件
    一、概述在html5中,相对于之前添加了不少新的元素和属性,在javascript中也添加了一些新的API,这些给我们的开发带来了很多便利。但由于各浏览器的发展步骤不一致,也导致了不同浏览器对html5支持的差异性。 二、实现原理1.在该html5实现的文件批量上传组件中,我们主要是利用html5中的一......
  • TuGraph Analytics交互式图查询:让图所见即所得
    作者:廖梵抒TuGraphAnalytics提供了OLAP图分析能力,实现图上的交互式查询,用户在构图并导入数据之后,可以通过输入GQL语句对图查询分析,并以可视化的方式直观地展示点边结果。OLAP架构在TuGraphAnalyticsOLAP架构中,主要以下组件:Client:用户通过Client提交查询语句,Client负责和Co......