首页 > 其他分享 >龙蜥白皮书精选:SysAK—大规模复杂场景的系统运维利器

龙蜥白皮书精选:SysAK—大规模复杂场景的系统运维利器

时间:2023-08-29 18:32:37浏览次数:39  
标签:运维 SysAK 系统 白皮书 诊断 监控 工具

文/系统运维 SIG

01

概述

SysAK(System Analyse Kit)是龙蜥社区系统运维 SIG,通过对过往百万服务器运维经验进行抽象总结,而提供的一个全方位的系统运维工具集,可以覆盖系统的日常监控、线上问题诊断和系统故障修复等常见运维场景。工具的整体设计上,力图让运维工作回归简单,让系统运维人员不需要深入了解内核就能找出问题的所在。

02

技术方案 

SysAK 在功能集上会进行全方位覆盖,垂直打通整个应用的生命周期。当前工具支持监控和诊断两种模式。其中监控模式下 SysAK 常驻后台,为运维人员提供系统的各项指标。而诊断模式随用随启,主要用于分析不同运维场景下的系统现象诊断与程序控制等。其整体功能如下图所示:

龙蜥白皮书精选:SysAK—大规模复杂场景的系统运维利器_应用场景

SysAK 不仅限于一个工具集,除了提供系统运维工具本身外,还设计实现了一套工具开发框架。并通过松散耦合、依赖管理、多架 构多版本的构建支持等方式,保障了工具开发者,一次开发,无需额外工作,就能在主流的架构和操作系统版本上集成。其整体结构如下图所示:

龙蜥白皮书精选:SysAK—大规模复杂场景的系统运维利器_白皮书_02

03

应用场景 

SysAK 提供的诊断工具可满足不同应用场景的运维需求:

  • 日常监控:针对各种系统资源更精细化的资源监控,帮助业务运维实现细粒度的运维调度和资源控制。除此之外,还实现了许多增 强的系统指标,实时监控系统的干扰和抖动等情况。
  • 问题诊断:针对负载异常、网络抖动、内存泄漏、IO 夯、性能异常等情况提供线上诊断功能。同时减少工具的专业性,可操作性强。
  • 故障修复:对于非整机异常的问题(例如死锁、夯机等), 该工具提供介入能力对系统进行恢复或故障隔离。


更多龙蜥白皮书精选内容,点击这里查看。

相关链接:

系统运维 SIG

https://openanolis.cn/sig/sysom

更多龙蜥技术特性解析可移步《龙蜥特性百科》:

https://anolis.gitee.io/anolis_features/

2022 龙蜥社区全景白皮书(或公众号【OpenAnolis龙蜥】回复关键字“白皮书”获取)

https://openanolis.cn/openanoliswhitepaper

—— 完 ——

标签:运维,SysAK,系统,白皮书,诊断,监控,工具
From: https://blog.51cto.com/u_15308345/7279198

相关文章

  • DevOps 运维平台审计开发
    过期提醒过期配置页通知消息:......
  • Prometheus监控运维实战十: 主机监控指标
    在上一篇文章中我们学习了如何通过node-exporter获取主机监控信息。但安装好监控只是第一步,我们还需要知道哪些监控指标是我们需要关注的。本文将对Prometheus相关的主机监控指标进行介绍。一.CPU监控CPU负载node_load1node_load5node_load15 以上三个指标为主机的CPU平均......
  • 为什么自动化运维难以推广
    从价值流的角度去分析:devops为何能做到高度自动化,而自动化运维难以推广,因为devops是从价值流出发,是服务于最终用户的,提升最终用户获得价值的效率,有巨大的推动力。而自动化运维只是从运维内部来推动,帮助运维团队提升工作效率,说白了直接受益者还是运维内部,客户感知不强烈。从价值角......
  • 纯水设备智能运维管理系统,远程监控,故障预警
    纯水设备适用于生产纯净水的设备,一般包括原水处理设备、海水淡化设备、地下水处理设备、超滤设备等,在电子、化工、食品、医药、海水淡化等领域应用广泛。为增强纯水设备的生产管理与故障预警能力,数之能提供设备智能运维管理系统,旨在提高纯水设备的管理效率和可靠性。包括以下功能: ......
  • FTP传文件容易丢失且运维管理难,是否有好的替代传输产品?
    文件传输协议(FTP),诞生于1971年,自20世纪70年代发明以来,FTP已成为传输大文件的不二之选。内置有操作系统的FTP可提供一个相对简便、看似免费的文件交换方法,因此得到广泛使用。后来由于FTP缺乏足够的安全性,市场中也引入了其他的协议,比如文件传输安全协议(FTPS)和安全的文件传输协议(S......
  • 智慧电力运维物联网平台
    我们构建软硬件结合的生态系统,打造电力设备物联平台,实现软件、硬件、平台、云数据一体化。在硬件领域通过自主研发推出了一系列电力领域的硬件设备,包括:智能电力测控终端、智能电力采集终端等产品。在软件领域,我们搭建电力设备物联平台。传统电力行业设备接入我们的电力设备物联平......
  • 系统运维的工作具体做什么?(每天的工作----------掌握)
    系统运维日常巡检都做什么原创 六便士IT 六便士IT 2023-07-2511:00 发表于陕西收录于合集#Linux运维34个系统运维日常巡检是确保服务器和系统正常运行的关键活动。它涉及对硬件、软件和网络进行定期检查,以发现潜在问题并采取相应的措施。以下是系统运维日常巡检的一......
  • Linux运维工程师面试题(3)
    Linux运维工程师面试题(3)祝各位小伙伴们早日找到自己心仪的工作。持续学习才不会被淘汰。地球不爆炸,我们不放假。机会总是留给有有准备的人的。加油,打工人!1LVS的工作模式有几种,分别是什么三种:NAT模式:修改请求报文的目标IP,多目标IP的DNATDR模式(默认模式):操纵封装新的M......
  • 推荐三款适合运维小白的网络监测工具
    对于刚刚步入职场的运维小白而言,面对工作中的突发情况时常会感到手忙脚乱,为了帮助他们更好地应对这些挑战,本文将介绍三款特别适合运维新手使用的网络监测工具:1.Zabbix是一个功能强大的网络监控系统,可以监视各种网络设备的性能指标、应用的运行状态等,并提供实时的报警和告警功能。......
  • 逐梦起航 职等你来,北京校区Linux运维89期开班啦!
    8月心情,喜忧参半。8月是一个特殊的季节,它是夏季的最后一个月份,也是当代大学生的一个新起点,有人因为高考得利,即将远离家乡,背起小小的行囊奔赴大学;有人则因为高考失利,面临着重新规划自己学习和职业道路的挑战。与此同时,在这个毕业的季节,有人选择出国深造,有人选择托关系找工......