首页 > 其他分享 >手把手带你认识GaussDB轻量化运维管理工具

手把手带你认识GaussDB轻量化运维管理工具

时间:2024-03-08 14:22:38浏览次数:39  
标签:运维 GaussDB 管理工具 升级 实例 容灾 节点

本文分享自华为云社区《GaussDB轻量化运维管理工具介绍》,作者: Gauss松鼠会小助手。

一、GaussDB 运维管理平台简介

cke_152.png

开放生态层

  • 友好Web界面,多云皮肤个性化定制
  • 丰富的原子API
  • 公有云、合运营、HCSO、边缘云IES、HCS、轻量化、统一版本

基础+智能运维能力

  • 丰富的基础运维能力
  • 打造端到端全链路的智能自制运维平台,覆盖自监控、自诊断、自调优、自恢复和自安全全量功能,一键部署,精准实施;

标准化代理层

  • 全方位多层安全防护,精细隔离设计
  • 精准管理进程资源消耗控制,极少性能损耗
  • 标准化南向接口规范各引警插件化接入原子操作

通过授权,登录到GaussDB运维管理平台,我们可以看到如下界面:

1、实例总览界面

cke_153.png

2、实例详情页面

cke_154.png

二、GaussDB 运维管理平台功能介绍

1、平台管理功能

作为管控平台,云数据库GaussDB管理平台具备完善的安全防护策略。主要是通过用户角色和用户组划分,细粒度的控制各个角色的访问执行权限,守护运维的安全。

cke_155.png

基本功能:

1、管理用户(user): 支持管理员对普通用户进行增加、删除、锁定、重置密码、用户和实例(Instance)、用户组的绑定等操作

2、管理用户组(user_group): 可以将用户加入用户组中,针对整个用户组可以设置统一的角色,用户可以同时加到多个用户组中

3、角色管理(Role): 可以自定义角色,增加对应的权限(permission),支持细粒度权限

4、管理活跃用户会话: 可以查看当前登录中的用户,管理员可以结束会话

5、后台功能: 提供鉴权、校验弱密码等接口,密码会校验规则和弱密码,加密后存入元库中。

2、实例管理功能

cke_156.png

1、实例纳管

2、实例解除纳管

3、实例启停

4、实例扩容

5、实例升级管理

6、实例容灾管理

7、实例告警管理

8、实例巡检管理

三、GaussDB管理平台实例管理基本功能

1、纳管实例

  • 数据库实例安装完成后,状态为Normal>则可以使用GaussDB管理平台将实例进行纳管。
  • 纳管前需将实例主机录入主机管理中进行管理。
  • 输入实例节点任意一个管理IP地址,点击检查实例节点,检查主机是否已经录入主机管理,主机状态在线则已经录入允许导入,主机状态离线则未录入,无法执行导入。
  • 所有主机都在线后。输入实例名称,管理员用户名,管理员密码点击提交按钮下发纳管流程。

1.1 添加主机

cke_157.png

1.2 纳管实例

cke_158.png

2、取消纳管实例

cke_159.jpeg

  • GaussDB 运维管理平台可以取消纳管已经导入并纳管的数据库实例。
  • 首先在主页上找到要取消纳管的实例
  • 点击“更多”->“取消纳管”
  • 页面弹出对话框进行管理员密码的输入

3、实例启停

GaussDB 运维管理平台支持对所纳管的数据库实例进行基本的启停操作,主要包括停止实例启动实例、重启实例等。

cke_160.png

  • 在主页找到需要管理的实例,点击“更多”–>“停止实例”来停止实例运行
  • 对于已经停止运行的实例,点击“更多”–>“启动实例”来启动实例运行
  • 也可以直接点击“更多”–>“重启实例”来快速对实例进行重启

4、实例卸载

GaussDB 运维管理平台支持对所纳管的数据库实例进行一键式卸载。

cke_161.png

注:删除实例属于高危操作,需要输入“delete”进行二次确认。

  • GaussDB 运维管理平台可以一键式删除已经导入并纳管的数据库实例。
  • 首先在主页上找到要删除的实例,然后点击“更多”->“删除实例”。
  • 页面弹出对话框进行二次确认。

5、节点扩容

随着业务的增长,数据库在运行性能及存储上逐渐会达到瓶颈。此时,需要通过增加节点来提升实例的性能及存储能力。GaussDB支持节点扩容操作。扩容方案如下:

cke_162.png

cke_163.png

在线扩容主要分为加节点和数据重分布两个阶段,除切换元数据外均支持在线业务。

  • 加节点阶段:主要完成新的CN/DN节点的安装、元信息同步、启动等操作。
  • 数据重分布阶段:主要完成基线数据搬迁、增量数据搬迁(在线业务)、切换元数据等操作。

cke_164.png

注:同步元信息的目的在于为后续数据重分布做准备

向新增的DN、CN节点同步元数据:

1、同步基础元信息:数据库、模式、表空间

2、同步普通元信息:用户表、函数

3、建立新的nodegroup(为扩容后的新集群)

4、元信息同步完成后切换installation group为新建nodegroup

GaussDB 运维管理平台支持对所纳管的分布式数据库实例进行节点扩容。

cke_165.png

  • “实例管理”界面,单击具体实例名称,进入“基本信息”界面。
  • 在“数据库信息”模块的“节点数量”后,单击“添加”进入“节点扩容”页面。

cke_166.png

  • 选择节点数量和管理地址,管理地址数量需要与新增节点数量一致,管理地址可用区分布需要符合部署方案。
  • 确认“实例扩容过程中会有锁表操作,可能会阻塞业务,属于高危操作。请选择在业务低峰期进行该操作。” 风险提示信息,并勾选“我已确认阅读上述风险提示”。
  • 单击“下一步”进入“规格确认”界面。

cke_167.png

  • 确认无误后,单击“提交”,进行扩容。
  • 数据库实例状态将显示为“添加节点中”,则说明扩容指令下发成功。

注意事项

  • 扩容是指分片扩容,扩容的节点仅包含CN、DN,不含有其他组件。
  • 扩容以节点组为单位,扩容节点的组件分布形态与扩容前实例分布规律相同。
  • 主备版部署模式暂时不支持扩容。
  • 存在故障节点的实例不允许扩容。
  • 实例扩容过程中会有锁表操作,可能会阻塞业务,属于高危操作。请选择在业务低峰期进行该操作。
  • 扩容前,需要满足所有DN节点剩余可用空间大于DN节点的最大单表空间。

四、GaussDB管理平台实例升级功能

1、GaussDB升级方式

升级过程涉及系统表和数据表变更,重启进程,有版本兼容风险和业务中断问题,根据升级方式,业务中断时间,风险评估对比如下:

cke_168.png

大小版本升级方式比较

cke_169.png

2、就地升级

cke_170.png

  • 找到需要升级的实例点击更多进行版本升级
  • 版本升级选择就地升级方式
  • 选择对应的目标版本

3、灰度升级

灰度升级分为两种方式:

1、升级自动提交方式: 所有节点一起升级,在升级过程中有大概10秒的业务中断

2、升级待观察后提交方式: 将数据库升级过程细分为升级待观察和升级提交两个阶段

  • 升级待观察阶段

    升级待观察阶段可以按照AZ升级,也可以对升级的AZ进行回滚,所有AZ升级完成后可以对实例进行业务测试

  • 升级提交阶段

    提交当前的升级,提交后不可回滚

3.1 灰度升级-升级自动提交

cke_171.png

  • 在实例管理主页找到需要升级的实例点击“版本升级”。
  • 在弹窗中选择升级自动提交的操作方式和目标版本进行升级。

3.2 灰度升级-升级待观察阶段

cke_172.png

  • 灰度升级选择升级待观察
  • 选择升级可用区中AZ进行升级
  • 选择目标版本进行升级

3.3 灰度升级-升级待提交阶段

cke_173.png

  • 升级完所有可用区的AZ之后,选择提交升级,对实例进行真正的升级
  • 观察阶段发现升级的版本有问题,可以选择升级回退

五、GaussDB 运维管理平台实例容灾管理

GaussDB 运维管理平台流式容灾管理的主要功能:

  • 容灾搭建
  • 容灾状态查看
  • 容灾倒换
  • 灾备升主
  • 容灾解除
  • 容灾演练(规划中)
  • 容灾快速加回(规划中)

流式容灾:基于流复制的容灾解决方案

cke_174.png

1、容灾搭建

cke_175.png

  • 主数据库实例配置灾备数据库实例信息,等待灾备数据库实例连接过来进行全量复制
  • 灾备数据库实例完成全量build之后,将与主数据库实例建立流式复制进行日志的增量复制

cke_176.png

2、容灾状态查看

cke_177.png

在容灾管理界面,可以查看到已经创建好的容灾关系组,并支持对容灾实例进行容灾倒换、灾备升主、容灾解除等操作。

cke_178.png

如上图,在容灾详情页面,可以查看容灾基本信息,容灾RTO、RPO数值,以及灾备状态指标;灾备实例分片日志差距、灾备实例分片日志落盘速率、灾备实例分片待回放日志量、灾备实例分片日志回放速率。

3、容灾倒换

cke_179.png

  • 可以通过容灾倒换,将容灾关系中主备实例角色互换,原来的主变为备实例,原来的备变为主实例
  • 容灾倒换命令不会解除容灾关系

cke_180.png

4、灾备升主

cke_181.png

可以通过灾备升主,将容灾备实例提升为一个包含主DN的实例,使其可以对外提供服务,升主成功后,之前的容灾关系将失效。

cke_182.png

5、容灾解除

cke_183.png

  • 容灾解除,是使得主实例清除维护的对端容灾信息。
  • 清除后,主实例可以重新建立新的容灾关系。

6、容灾演练

1.准备两个正常的实例

2.创建两个实例的容灾关系

cke_184.png

3.主实例发生严重故障

cke_185.png

4.对备实例进行升主,对外提供服务

cke_186.png

5.对主实例进行维修,然后执行容灾解除

6.重新搭建容灾关系

cke_187.png

7.进行容灾倒换,恢复初始的容灾关系

cke_188.png

六、GaussDB管理平台实例监控告警

1、告警统计

实时告警与历史告警:

  • 告警基本信息:告警id,告警名称,告警类型,告警状态类型、告警实例
  • 告警表现:告警时间、告警级别、告警描述、告警持续时间、告警节点IP、通知状态
  • 告警数据分析:告警可能原因、影响、优化建议

cke_189.png

2、告警管理

cke_190.png

告警模板管理:默认模板包括默认文本模板以及默认JSON模板

3、监控大盘

列表看板:

通过将实例进行平铺展示的方式,横向对比各个实例的基本指标信息,包括CPU使用率、内存使用率等。

cke_191.png

趋势看板:

cke_192.png

  • 展示单个实例的全方位详细监控指标。
  • 指标范围包括:CPU/内存、磁盘/存储、网络、连接、业务负载锁、同步状态、进程资源等。

希望本节课程对大家对GaussDB运维管理平台的工具有所了解,欢迎大家共同学习交流。

 

点击关注,第一时间了解华为云新鲜技术~

 

标签:运维,GaussDB,管理工具,升级,实例,容灾,节点
From: https://www.cnblogs.com/huaweiyun/p/18060868

相关文章

  • 运维工单系统哪家好?
    数字化转型数字化时代已然到来,企业运维工作的重要性日益突出。为了满足各类企业的运维需求,市场上涌现了诸多运维工单系统厂家,包括卓豪ServiceDeskPlus、Zendesk、Zenduty、JiraServiceDesk等。而选择合适的运维工单系统,对于提高运维效率和服务质量至关重要。运维工作扮演着至......
  • Xterminal-SSH管理工具推荐
    官网常做服务器取证、网站重建的童鞋们都知道,我们需要频繁的阅读、修改文件或是代码,而Xterminal就支持远程直接查看、修改文件同时它还支持常用命令的提示(虽说全部提示需要购买会员)同时也是支持本地终端的使用当然sftp是必然带的(点名某Shell)还可以添加常用命令,双击即可......
  • 让运维无忧,实战解析巡检报告功能实现方案
    随着大数据技术的演进和信息安全性需求的提升,数据规模的持续扩张为数据运维工作带来了严峻考验。面对海量数据所形成的繁重管理压力,运维人员面临效率瓶颈,而不断攀升的人力成本也使得单纯依赖扩充运维团队来解决问题变得不再实际可行。由此可见,智能化与高效便捷是运维发展的必然方......
  • kubernetes可视化管理工具KubePi体验简介
    kubernetes可视化管理工具KubePi体验简介原创 zhuhb 运维笔谈 2024-03-0111:55 上海 听全文推荐一个飞致云开源的kubernetes可视化面板KubePi,Github地址https://github.com/1Panel-dev/KubePiKubePi可以导入多个Kubernetes集群,并且通过权限控制,将不同cluster......
  • Rust 开发的高性能 Python 包管理工具,可替换 pip、pip-tools 和 virtualenv
    最近,我在Python潮流周刊中分享了一个超级火爆的项目,这还不到一个月,它在Github上已经拿下了8Kstar的亮眼成绩,可见其受欢迎程度极高!国内还未见有更多消息,我趁着周末把一篇官方博客翻译出来了,分享给大家。作者:@charliermarsh译者:豌豆花下猫@Python猫英文:uv:Pythonpackag......
  • windows11下安装使用python多环境管理工具--poetry
    官网https://python-poetry.org/基础环境系统版本python版本poetry版本win1123H2多版本+3.6.8(默认)+3.8.6+3.10.41.8.2安装https://python-poetry.org/docs/我们选择脚本的方式安装使用powershell安装安装命令(Invoke-WebRequest-Urihttps://ins......
  • 图扑数字孪生水电站,水力发电可视化运维
    自水轮机的早期发明被用于农业灌溉,到18世纪末期的工业革命促使水轮机技术的改良,再到19世纪末水利发电的崛起,直至今日,智慧水电站数字孪生技术正处于蓬勃发展之中。通过整合物联网、大数据、云计算等现代信息技术,水电站数字孪生可用于设计、建造、运行和维护等各个环节。能实时......
  • BUG管理工具(JIRA)的基本使用
    此处以jira为例(其他工具大同小异,自行了解)首先测试人员发现问题后,有截图时,需先自行保存(命名最好描述简介明了,以免管理工具上传有误)1.打开公司给的访问JIRA的链接,输入公司给你注册的账号和密码,点击登录2.点击JIRA主菜单上的“创建”,进入编辑bug界面3.关联项目问题类型:点击输入......
  • GaussDB跨云容灾:实现跨地域的数据库高可用能力
    本文分享自华为云社区《GaussDB跨云容灾:实现跨地域的数据库高可用能力》,作者:GaussDB数据库。金融、银行业等对数据的安全有着较高的要求,同城容灾建设方案,在绝大多数场景下可以保证业务数据的安全性,但是在极端情况下,如遇不可抗力因素等,要保证数据的安全性,就需要采取跨地域的容灾......
  • 中国联通全球托管运维服务:助力企业无忧应对数据中心运维挑战
    在全球化背景下,企业的信息化进程不断加快,数据中心作为支撑关键业务的核心基础设施,在全球范围内的布局与运维变得愈发重要。然而,企业在设立异地或海外数据中心时,常常面临资源有限、人力短缺等问题,特别是在目标地缺乏专业的IT工程师团队时,如何确保数据中心的稳定运行与高效管理成为......