首页 > 其他分享 >一文看懂可观测:盯得住系统,扛得住稳定

一文看懂可观测:盯得住系统,扛得住稳定

时间:2024-05-31 16:22:56浏览次数:17  
标签:服务 一文 运维 系统 观测 阿里 云可 扛得住

庞大的 IT 系统犹如一个超级工程

如何保障这个超级工程高效又稳定?

要靠:可观测(Observability)

什么是可观测?

可观测(Observability) 是对 IT 基础设施、系统应用、业务及用户反馈等关键环节的监控、分析和系统诊断能力。

作为系统中的“大脑”,「 可观测 」加工处理各类数据,最核心的有三种:日志(Log)指标(Metric)以及链路(Trace)

这三类数据,是构建系统情况全方位“大屏”的基石,一旦有任何“风吹草动”,相关团队就能第一时间侦测到,及时干预、诊断和修复异常情况。

Gartner 已将应用可观测列为“2023 年十大战略技术趋势”,它已逐渐从运维排查问题工具,进化成为生产力工具。

创办于2009年的阿里云,始终在技术上坚持创新与突破,在可观测领域中也成为国内唯一入选 Gartner 应用性能监控与可观测魔力象限报告的云厂商。

「 可观测 」产品如何诞生?

始于业务需求

2012 年左右,淘宝电商业务爆发,阿里程序员们采用了微服务架构重构了整个业务逻辑。应用服务更加灵活敏捷,但运维管理却愈发复杂,甚至当时没有一个业务架构师能够讲清楚整个业务系统架构是什么样的。此刻,谁能盯好如此高速运转且复杂多样的系统,成为一个十分急迫的需求!

2013年,阿里集团正式运营服务器规模达到5000(5K)的“飞天”集群,成为世界上第一个对外提供5K云计算服务能力的公司,庞大的服务器规模也让运维监控难度陡然提升。

基于自身需求研发

于是,这一年阿里云可观测的里程碑产品,EagleEye 、iLogtail 相继诞生。

这两位,可以说是阿里云可观测的双子星,生于云,长于云,是云原生最具代表性的产品之一。并且二者不断升级迭代,不仅提高内部系统运维协作效率,还大幅度降低了运维成本。

上线全栈统一可观测平台

在不断努力下,「可观测」已经在阿里云落地成为成熟的全栈统一可观测平台。

现如今,已经可以对外向开发者和客户提供数据采集、加工、投递、分析、应用(告警&可视化)等一系列能力,以及大规模、低成本、实时性的平台化服务。

服务千行百业,拥抱开源生态

截至目前,阿里云可观测产品已为数十万云上客户提供服务,我们也不断收到来自千行百业的用户们的反馈和新需求。

正是伴随着技术进步与开发需求变化,在可观测领域,开源的OpenTelemetry是一个可能的最优解。

基于此,阿里云可观测系统全面升级啦!

划重点如下:

  • 核心产品全面拥抱OpenTelemetry开源生态及标准

应用实时监控服务ARMS等核心产品全面拥抱OpenTelemetry开源生态及标准,实现端到端的可观测全覆盖,并全新推出AI大模型应用的观测视图。

  • SLS日志服务实现引擎重磅升级

同时,作为可观测的核心基石的阿里云日志服务SLS,也实现了引擎重磅升级,数据加工及处理的性能提升10倍,并降低60%成本,三大全新能力一次性上线。

最后,压轴播放一个好消息,此次升级的 ARMS 与 SLS 服务均已在阿里云官网上线,企业和开发者可登录官网搜索“应用实时监控服务 ARMS”免费试用体验!

点击此处,立即体验!

标签:服务,一文,运维,系统,观测,阿里,云可,扛得住
From: https://www.cnblogs.com/alisystemsoftware/p/18224786

相关文章

  • 一文掌握可视化拖拽工作流的突出优势
    实现高效率办公,可以采用什么样的软件平台?低代码技术平台就是一款助力企业数字化转型升级,进入高效率流程化办公时代的得力助手。关于低代码技术平台、可视化拖拽工作流的优势、特点的相关内容,会在本文中进行重点介绍。想要摆脱信息孤岛、部门协作沟通不畅的局面,可以来了解低代码技......
  • 一文看懂企业HPC环境下数据传输常见问题及解决方案
    HPC通常指的是“高性能计算”(High-PerformanceComputing)。高性能计算是计算机科学的一个分支,专注于构建和使用能够执行计算密集型任务(如模拟、数据分析、可视化等)的计算机系统。这些系统通常包括多个处理器(CPU)、图形处理器(GPU)、专用加速器或其他类型的计算单元,它们通过网络连接......
  • 一文搞透常见的Python编码陷阱(上)(分析+案例)
    一个认为一切根源都是“自己不够强”的INTJ个人主页:用哲学编程-CSDN博客专栏:每日一题——举一反三Python编程学习Python内置函数Python-3.12.0文档解读目录一、别忘了冒号1.if语句2.while语句3.for语句4.函数定义5.类定义6.try/except语句7.with语句......
  • 一文搞懂C++继承、多继承、菱形继承、虚继承
    继承目录继承继承继承的访问权限子类赋值给父类赋值兼容规则“天然”的行为验证:1.其他权限继承能否支持赋值兼容规则2.是否"天然",有没有产生临时变量继承中的作用域继承的构造函数继承的拷贝构造继承的operator=继承的析构函数析构顺序析构的特殊处理继承中的static成员设计一......
  • 一文搞懂 MySQL 日志
    前言MySQL的日志记录了运行的各种信息,是MySQL事务、性能、数据容灾、异常排查等的基础。本文将介绍MySQL一些关键日志的作用和原理。MySQLInnoDB引擎重要的三个日志:日志说明redolog重做日志,保证事务的持久性undolog回滚日志,来保证事务的原子性binlo......
  • 一文搞懂:什么是数字化IT运维?(一)
    写在前面随着数字化转型在各个组织的落地,新技术、新应用不断上线,对于IT运维也提出新的挑战和需求。数字化时代,IT运维如何利用数字化能力,提升IT运维的效能?未来我们在建设IT运维时,该如何建立数字化IT运维,今天我们来讨论这个话题,帮助大家在未来规划数字化IT运维时能够有一定的参......
  • 适用于各行业的数据传输管控解决方案,一文了解!
    数据传输管控是一个重要的领域,它涉及到确保数据在不同系统、用户和组织之间传输时的安全性、合规性以及效率。以下是一些关于数据传输管控的关键点:安全可控的数据交互:随着数据量的爆炸式增长,企业和组织需要确保数据交互是安全和可控的。这包括内部用户和系统之间以及与外部合作伙......
  • 一文了解java枚举
    1.枚举的由来当我们知道所有变量的可能性时,尽量使用枚举类型来定义,比如季节,春夏秋冬,一周(一二三四五六七),只读不需要修改有限的一个一个列举出来的类叫做枚举类,枚举是一组常量的集合,枚举也是一个特殊的类,里面包含了一组有限的特定对象2.自定义实现枚举不需要提供......
  • GIt快速入门(一文学会使用Git)
    GIt快速入门文章目录GIt快速入门一、为什么要学习Git二、Git的安装1.安装Git2.下载GUI三、Git的概念1、版本控制2、集中式控制3、分布式控制4、多人协作开发1.并行开发2.分支管理3.冲突解决4.代码审查5.分布式特性四、Git客户端操作1.界面介绍2.提交操作3.创建分支4......
  • 一文讲透MySQL锁机制
    数据库是一个多用户使用的共享资源,当多个用户并发地存取数据时,在数据库中就会产生多个事务同时存取同一数据的情况。若对并发操作不加控制就可能会读取和存储不正确的数据,破坏数据库的一致性。加锁是实现数据库并发控制的一个非常重要的技术。当事务在对某个数据对象进行操作......