数据库自治运维技术领域，GaussDB也有大作为

时间：2024-10-30 11:59:54浏览次数：6

在数据库自治运维技术领域，主要分为两条技术路线。其一是以Oracle为主的老牌数据库厂商，构建运维及生命周期管理统一逃课，实现大规模的数据库智能化管理能力；对用户通过运维工具指导业务快速升级和排障，对业务通过内置的优化诊断套件和多维度报表，快速定位性能瓶颈问题和实现SQL的快速优化。这种方案在单一集群或小规模集群是高效的，通过DBA能力复制，可快速完成运维技术的应用。另一种是以新兴云厂商为主，构建基于云化设施和环境的自治运维技术。尽管各家的技术不近统一，主体思路是一致的，即尽可能通过一套运维管理系统，纳管云化多套环境，通过机器学习技术和海量数据，训练高效诊断和优化模型，形成标准化运维套路。GaussDB基于机器学习技术和云上海量数据信息，构建领先的自治运维管理系统，通过成熟算法实现负载感知、环境感知和数据感知，为数据库提供自监控、自诊断、自调优、自安全的能力，为客户和DBA提供极佳的运维管理体验。
在这里插入图片描述

上图为GaussDB的自治运维系统整体框图。

数据采集层实现多维指标的数据采集，采集频率根据内容不同可分为秒级采集和分钟级采集。其中秒级采集包括操作系统资源信息采集和数据库实例信息采集，例如操作系统层面CPU、内存、IO读写、网络资源信息采集，数据库实例状态、数据库内关键指标（内存、连接数、TPS、QPS、读写频率等）；分钟级采集包括审计日志采集、数据库日志采集和全量SQL流水采集等。自治运维平台提供采集程序（Agent进程），可部署在数据库服务侧或者远端，连接数据库实例或所在服务器，采集上述指标；若客户系统配置普罗米修斯进行信息采集，可实现相应的exporter，在其中内置数据库多维度指标采集方法以及数据清理方案，实现与普罗米修斯平台对接。数据库采集端程序需要部署在同数据库进程所在物理节点时，若数据库为多节点集群环境，每个物理节点可部署一个Agent进程采集端（或者普罗米修斯采集端）。

数据库采集端程序通常占用资源很少，通过配置文件可以制定不同指标采集频率，以免占用资源影响数据库业务正常运行。数据计算层提供数据存储、数据分析及元数据管理能力。其中数据存储用于接收来自数据采集层发生来的数据，存储数据源可以是多种维度或者类型，包括普罗米修斯、时序数据库（OpenTSDB等）、MongoDB、SQLite等，自治运维服务内置对接接口，每个自治服务模块与存储数据源的交互，获取数据并进行分析处理。在企业实际应用时，可根据需要选择不同的存储组件和大数据处理组件，例如普罗米修斯+时序数据库，或者kafka+时序数据库等方案。在数据计算层除了时序存储数据库外，还可以设计其他存储单元，例如算法模型库和故障规则库。

其中算法模型库存储自治管理服务生成的AI模型，例如参数推荐训练模型；在算法模型库中，可以存储传统机器学习（例如监督学习）模型、强化学习模型。故障规则库是记录数据库常见故障案例，将这些案例通过拆解和分析，生成规则引擎。自治服务层在用户维度，可以分为SQL诊断和调优、自治安全、数据库运维。其中SQL诊断和调优提供多种SQL治理和调优能力，包括慢SQL诊断、SQL表现评估、智能索引推荐、智能查询重写等服务。

自治安全通过AI技术实现敏感信息发觉、SQL注入检测和异常行为分析。数据库运维能力实现在数据库系统、OS系统和数据库集群层面的运维和调优，其中数据库系统服务包括数据库参数智能推荐、智能巡检、数据库分布键推荐和智能业务调度；在操作系统层面，实现慢盘检测和恢复、网络丢包检测；在数据库集群层面，基于故障或者负载需求，提供自动扩缩容、异常节点修复服务。

自治运维服务最终需要通过管控网页界面形式对外呈现，方便用户直观感受运维管理带来的效果。在展示界面方面，多指标结合AI趋势预测，可给出后续时段的数据走向。同时为方便用户系统观察集群状态，提供健康指数报告和详细综合报告。

健康指数报告给出当前系统的健康评分等级，默认80分以上属于运行健康状况，小于60分则存在严重隐患，急需修复。综合报告详细描述系统各维度信息，包括集群状态、负载运行情况、常见数据库指标项信息。

标签：存储,运维,自治,GaussDB,采集,SQL,数据库
From： https://www.cnblogs.com/xiaoxu0211/p/18515599

如何使用云数据库GaussDB管理平台进行实例安装？
前言随着数字经济的蓬勃发展，数据库也成为企业的关键技术生产力，也是各行各业数字化转型的必要根基。GaussDB作为新一代分布式数据库，核心代码100%自主创新，具备高可用、高安全、高性能、高弹性、高智能、易部署、易迁移的特性，是当前国内唯一能够做到软硬协同、全栈自主的数据库，目......
GaussDB数据库中逻辑对象关系简析
初次接触openGauss或GaussDB数据库的逻辑对象，被其中的表空间、数据库、schema和用户之间的关系，以及授权管理困惑住了，与熟悉的MySQL数据库的逻辑对象又有明显的不同。本文旨在简要梳理下GaussDB数据库逻辑对象之间的关系，以加深理解。1、GaussDB数据库逻辑对象1.1表空间、Databas......
GaussDB数据库基础函数介绍2
二、GaussDB常用基础函数介绍与示例1、数字操作函数在GaussDB数据库中，数字操作函数是指用于执行数字操作的函数，例如加减乘除、取余、幂运算等。这些函数通常在数学、计算机科学和工程学等领域中使用，用于处理数字数据和执行数字操作。以下是一些常见的数字操作函数：--abs(x)--......
GaussDB数据库基础函数介绍1
前言函数是数据库中最基本的组成部分之一，它们用于定义和操作数据库中的表格、记录、索引和视图等对象。在数据库中，函数的作用非常重要，因为它们可以实现数据的复杂操作，如查询、更新、删除和排序等。作为华为自主创新研发的分布式关系型云数据库，GaussDB也拥有强大的函数支持体系。......
GaussDB数据计算路由层（Coordinator）关键技术方案
GaussDBKernelV5版本的Catalog还是本地存储,所以还需要考虑catalog的持久化问题.未来演进元数据解耦，Coordinator无状态,就不需要考虑Catalog持久化问题了。但是跨节点场景下的事务提交在Coordinator上还是要持久化的。图14Coordinator模块图路由信息：每个表数据共分16384......
GaussDB全局事务管理层（GTM）关键技术方案
GTM仅处理全局时间戳请求，64位CSN递增，几乎都是CPU++和消息收发操作。不是每次都写ETCD,而是采用定期持久化到ETCD里，每次写ETCD的CSN要加上一个backup_step(100w),一旦GTM故障，CSN从ETCD读取出来的值保证单调递增。当前GTM只完成CSN++,预估可以支持200M/s请求。GTM处理......
GaussDB集群管理层（CM）关键技术方案
GaussDBKernelV5集群管理层关键模块如下。图4集群管理层组件设计图CM组件提供了四种服务CMAgent,CMServer,OMMonitor,cm_ctl，与各类实例服务组件（CN,DN,GTM等）一起构成了整个数据库集群系统。cm_ctl通过命令行执行集群的启动、停止、状态查询、主备倒换、备机重建......
SpringBoot社区服务平台的设计与实现jm6z2（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表居民,活动类型,社区活动,活动报名,取消报名,新闻类别,社区新闻,优秀活动,水电费,缴费提醒,隔离采购,采购情况开题报告内容一、课题背景与意义随着信息技术的飞......
SpringBoot山猫体育新闻网y5ejn（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表用户,球队信息,比赛赛程,球员信息,精彩视频,比赛结果,篮球资讯开题报告内容一、课题名称山猫体育新闻网的设计与实现二、研究背景与意义随着互联网技术的飞......
SpringBoot人事管理912fw（程序+源码+数据库+调试部署+开发环境）
本系统（程序+源码+数据库+调试部署+开发环境）带论文文档1万字以上，文末可获取，系统界面在最后面。系统程序文件列表部门,员工,考勤信息,工资发放,员工请假,加班登记,迟到登记,培训信息,报名信息,文档档案,签到信息开题报告内容一、项目背景随着企业规模的扩大，人事管理变得日......

数据库自治运维技术领域，GaussDB也有大作为

相关文章

赞助商

阅读排行