首页 > 其他分享 >高效安全迁移:PG高可用集群实战方案深度解析

高效安全迁移:PG高可用集群实战方案深度解析

时间:2024-11-29 15:44:11浏览次数:8  
标签:同步 报表 RedHat 环境 集群 PG 解析 name

PostgreSQL是一个开源的数据库管理系统,相比于其他开源数据库系统,PostgreSQL有更加丰富的数据类型和可扩展性,并因此被广泛采用。在实际工作中,若企业业务需求变动,则有可能面临PG高可用集群迁移的情况。
云掣具备丰富的帮助企业迁移数据平台的实战经验,提供专业的数据库运维托管服务,本文旨在通过一次PG高可用集群环境迁移但IP不变的成功客户案例,结合云掣在多次客户数据迁移过程中总结出的宝贵经验,与大家分享两种安全稳定迁移PG高可用集群的方案,并将两种方案的优缺点进行了对比,便于大家根据自己的情况择优选择。

一、客户背景
某客户线下环境有2套PG高可用自建集群,由于之前使用的CentOS系统,官方已经不再维护了,所以需由当前的CentOS环境迁至新的RedHat环境。2套PG均是REPMGR高可用集群架构,迁移切换后,新环境需使用旧环境的IP地址。

二、迁移方案
方案一
①在新的RedHat环境安装PG作为当前主库的从节点,通过REPMGR将当前主库数据克隆至RedHat环境的从节点。
②数据同步完成后安排时间先将CentOS环境的IP与RedHat环境的IP进行替换、然后将当前CentOS环境主节点切至RedHat环境的某个从节点。
③切换完成后,CentOS环境旧报表库的逻辑复制不再同步新数据,需在RedHat环境部署新报表库并重新创建新的逻辑复制将新主库数据同步至新报表库。
④RedHat环境新报表库数据同步完成后,重新部署新主库与新报表库的容灾备库。
⑤图例:
·新的RedHat环境搭建从库并克隆数据的架构图:

·切换RedHat环境的从库5、从库8为新主库,切换后通过逻辑复制同步新主库数据至新报表库的架构图:

方案二
在新的RedHat环境搭建与当前CentOS环境完全相同的集群架构,通过逻辑复制将CentOS环境主库的数据同步至RedHat环境的主库,数据同步完成后安排时间暂停所有PG、将CentOS环境的IP与RedHat环境的IP进行替换、修改相关配置文件后重启PG。

两种方案优缺点对比
方案一CentOS环境与RedHat环境之间PG的数据同步通过物理流复制实现,该方法的优点是同步数据速度快、操作简单、同步对象齐全。缺点是RedHat环境的报表库需要等切主后才能开始数据同步,报表库不可用的时间比较长。
方案二CentOS环境与RedHat环境之间PG的数据同步通过逻辑复制实现,逻辑复制操作麻烦、有很多限制,比如表必须都有主键、每个库都需要创建一个逻辑复制同步通道,逻辑复制的同步能力和稳定性比较差,可能出现同步状态异常或出现较大延迟。另外逻辑复制只同步数据,需用插件同步DDL语句,还需通过备份将CentOS环境的账号权限、视图等对象定义恢复至RedHat环境。该方法的优点是RedHat环境报表库的数据一开始就可以同步,报表库不可用的时间很短。

三、方案实施
确定操作方案
经与业务方沟通确认,报表库不可用时间长的影响较低,决定采用方案一进行迁移。
具体操作步骤
RedHat环境准备工作
①RedHat环境搭建PG、REPMGR,其中见证节点初始化PG,从节点采用REPMGR进行数据克隆、物理复制同步,记录数据克隆耗时及对当前主库的性能消耗影响。
②将RedHat环境部署的从节点和见证节点的PG,加入至当前主库所在的REPMGR集群。
③RedHat环境安装pg_probackup,用于WAL日志归档及备份任务设置。
④RedHat环境新报表库初始化PG。
RedHat环境新报表库同步测试
①梳理报表库数据信息
CentOS环境,当前报表库的数据分为3部分,第1部分由PG集群1的主库逻辑复制同步而来,第2部分由PG集群2的主库逻辑复制同步而来,第3部分是业务自身在报表库新增的schema。
对于RedHat环境的新报表库,第1、2部分的数据需待主库切换后由新主通过逻辑复制同步至新报表库,第3部分需要通过pg_dump将相关schema数据备份恢复至新报表库。
②备份恢复测试
针对业务自身在报表库新增的schema,需通过pg_dump备份的方式将数据恢复至新报表库,测试该部分数据备份恢复的耗时情况及期间的性能消耗情况。
备份恢复的方式是先用pg_dumpall将当前报表库所有对象结构进行备份再用pg_dump对相关schema的数据进行备份,相关命令如下:

--备份所有对象结构
pg_dumpall -s -U{user_name} -p{port} -f "/xxx/all_object.sql"

--备份指定schema数据
pg_dump -Fd -v -a -U{user_name} -p{port} -d{db_name} -n{schema_name} -j2 -f "/xxx/{schema_name}.dump"

--恢复所有对象结构
psql -U{user_name} -p{port} -d{db_name} -f /xxx/all_object.sql >> /xxx/all_object.log 2>&1

--恢复指定schema数据
pg_restore -p{port} -d{db_name} -U{user_name} -j2 /xxx/schema_name.dump >> /xxx/{schema_name}.log 2>&1
③逻辑复制同步测试
针对由PG集群1、2的主库逻辑复制同步至报表库的数据,将RedHat环境从库5、从库8作为单独新主启动,测试新主逻辑同步至新报表库所需耗时及期间的性能消耗情况。
RedHat环境从库5、从库8数据同步完成后,单独作为新主启动,作为测试逻辑复制同步的源端:

--操作步骤如下
a.stop PG;
b.修改postgres.auto.conf,注释掉synchronous_standby_names、primary_conninfo、primary_slot_name;
c.删掉pg data目录下的standby.signal文件;
d.start PG
创建RedHat环境新主至新报表库的逻辑复制同步任务:

--新报表库部分命令如下
create subscription {sub_name} connection 'host={master_ip} port={port} dbname={db_name} user={user_name} password={password}' publication {pub_name};

alter subscription {sub_name} refresh publication ;
RedHat新主库与新报表库安装pgl_ddl_deploy插件:

--新主库部分命令如下
CREATE EXTENSION pgl_ddl_deploy;
INSERT INTO pgl_ddl_deploy.set_configs (set_name,include_schema_regex,driver) VALUES('{pub_name}','{schema_name}','native'::pgl_ddl_deploy.driver);
SELECT pgl_ddl_deploy.deploy('{pub_name}') from pgl_ddl_deploy.set_configs;
SELECT pgl_ddl_deploy.add_role(oid) from pg_roles where rolname='{user_name}';
select * from pgl_ddl_deploy.set_configs;

--新报表库部分命令如下
CREATE EXTENSION pgl_ddl_deploy;
SELECT pgl_ddl_deploy.add_role(oid) from pg_roles where rolname='{user_name}';
alter subscription {sub_name} refresh publication;
正式切换整体步骤
①准备好RedHat环境,清理新报表库测试时的相关环境,令其满足切换条件,包括RedHat环境PG与REPMGR搭建完成、从库数据同步完成、新报表库初始化完成。
②因后续RedHat环境与CentOS环境IP需互换,IP更换后PG在REPMGR集群中需重新注册,提前注销REPMGR集群中的从节点、见证节点。
③关闭业务。
④关闭PG及监控,先关主库,后关从节点、见证节点、报表库、容灾备库,最后停监控告警。
⑤整体替换IP,将CentOS环境与RedHat环境的IP进行替换。
⑥修改REPMGR与PG相关配置文件中与IP有关的相关内容。
⑦启动PG,先启主库,后启从节点、见证节点、报表库。
⑧将主节点、从节点、见证节点重新注册至REPMGR集群。
⑨切主,将主节点由CentOS环境的主库切至RedHat环境的其中一个从库,切换后VIP会绑定新主。
⑩将切换后的旧主作为新主的从节点,重新加入REPMGR集群。
⑪ 开启监控告警。
⑫处理RedHat环境新报表库,将CentOS环境报表库自身产生的数据通过备份恢复至RedHat环境新报表库,将需同步的数据由RedHat环境新主库逻辑复制同步至新报表库。
⑬WAL归档与备份任务,确认复制同步状态及延迟情况,核对同步对象数量、表数据量是否一致。
⑭ 业务,确认业务是否正常。

四、总结
通过两种不同的迁移方案,均可实现PG高可用集群的迁移切换,便于结合业务需求使用更为稳定的物理复制同步方案,使客户的PG集群整体平稳迁至新环境。
云掣专注于可观测运维,致力解决企业上云难、用云难、管云难三大问题。基于云数据库提供7*24小时保障服务,提供开发支持、数据库体系规范、持续优化、数据库架构支持,保障企业数据库高效稳定运行。全面提升企业的运维效率和稳定性,助力企业完成云时代的数字化转型,满足客户在数据库管理和云迁移方面的多样化需求!
想了解或咨询更多有关云掣产品、服务、客户案例的朋友,点击云掣进入官网。

《数据资产管理白皮书》下载地址https://www.dtstack.com/resources/1073/?src=szsm

《行业指标体系白皮书》下载地址https://www.dtstack.com/resources/1057/?src=szsm

《数据治理行业实践白皮书》下载地址https://www.dtstack.com/resources/1001/?src=szsm

《数栈V6.0产品白皮书》下载地址https://www.dtstack.com/resources/1004/?src=szsm

想了解或咨询更多有关袋鼠云大数据产品、行业解决方案、客户案例的朋友,浏览袋鼠云官网:https://www.dtstack.com/?src=szsm

同时,欢迎对大数据开源项目有兴趣的同学加入「袋鼠云开源框架钉钉技术群」,交流最新开源技术信息,群号码:30537511,项目地址:https://github.com/DTStack

标签:同步,报表,RedHat,环境,集群,PG,解析,name
From: https://www.cnblogs.com/DTinsight/p/18576871

相关文章

  • 新手必看——ctf六大题型介绍及六大题型解析&举例解题
    CTF(CaptureTheFlag)介绍与六大题型解析一、什么是CTF?CTF(CaptureTheFlag),意为“夺旗赛”,是一种信息安全竞赛形式,广泛应用于网络安全领域。CTF竞赛通过模拟现实中的网络安全攻防战,让参赛者以攻防对抗的形式,利用各种信息安全技术进行解决一系列安全问题,最终获得“旗帜(Flag)”......
  • 针对Qwen-Agent框架的Function Call及ReAct的源码阅读与解析:Agent基类篇
    文章目录Agent继承链Agent类总体架构初始化方法`__init__`方法:`_init_tool`方法:对话生成方法`_call_llm`方法:工具调用方法`_call_tool`方法:`_detect_tool`方法:整体执行方法`run`方法:`_run`方法:`run_nonstream`方法......
  • 【Linux合集】单机部署zk集群
    创建存放目录/zk的多集群目录mkdir-p/data/{softwares,applications}/mkdir-p/data/applications/{zookeeper-server1,zookeeper-server2,zookeeper-server3}下载3.7.2版本zk先切目录到softwares下cd/data/softwares/wgethttps://archive.apache.org/dist/zookeeper/z......
  • 新能源汽车智慧充电桩:创新架构设计详解与高效上电流程解析
    随着全球对环境保护的日益重视,新能源汽车成为了未来的发展趋势。而充电桩作为新能源汽车的核心基础设施,其智慧化的解决方案对于推动新能源汽车的普及和发展至关重要。智慧充电桩不仅能够满足快速增长的电动汽车充电需求,还通过智能化管理提升了用户体验和运营效率。在这样的背景下,......
  • BackupBuddy pg walkthrough Intermediate
    nmap┌──(root㉿kali)-[~/lab]└─#nmap-p--A192.168.189.43StartingNmap7.94SVN(https://nmap.org)at2024-11-2902:10UTCStats:0:00:17elapsed;0hostscompleted(1up),1undergoingSYNStealthScanSYNStealthScanTiming:About8.81%done;ETC......
  • HTTP代理中的API提取链接解析?
    HTTP代理是网络中重要的组件,而API链接提取则是在HTTP代理中实现的一种关键功能。本文将深入探讨HTTP代理中的API链接提取,包括其工作原理、用途以及实现方法。我们将介绍API链接提取的背景和概念,详细说明其在代理服务器中的实现方式和应用场景。1、背景和概念HTTP代理充当了客......
  • 【2024认证杯小美赛A题】完整解析与代码分享(独家思路)
    A题木星:保护者还是威胁者1问题的概要1.1问题1:小行星带对地球的威胁评估1.2问题2:奥尔特云对地球的威胁分析1.3问题3:木星质量和轨道变化对威胁的影响2问题1:小行星带对地球的威胁评估2.1问题概要2.2数学模型2.2.1木星引力场的作用2.2.2轨道扰动模型2.2.3轨......
  • Tomcat新手成长之路:安装部署优化全解析(上)
    文章目录1.Tomcat简介2.Tomcat原理架构2.1.总体架构2.2.连接器2.2.1.具体功能2.2.2.IO模型2.2.3.逻辑处理流程2.2.4.内部处理流程2.3.容器2.4.启动过程2.5.请求过程3.Tomcat适用场景4.Tomcat与其他Web容器对比5.Tomcat安装和启动5.1.Java环境变量5.2.系统服务5.3.启动......
  • 【技术】英锐芯解析锂电充电管理芯片的基础知识和常见问题
    锂电充电管理芯片知识锂电充电管理芯片:实际就是一颗对锂离子电池进行充电以及指示其充电状态的专用集成电路。 其作用:1.负责给电池充电2.指示电池的充电状态 锂电充电管理芯片根据充电电池的串联数量划分为:单节锂电充电芯片双节锂电池充电芯片3节锂电充电芯片4节锂电......
  • LangChain——CSV_时间_枚举_Json_修复_重试解析器
    CSV解析器当想返回以逗号分隔开的项目列表时,可以使用输出解析器。fromlangchain.output_parsersimportCommaSeparatedListOutputParserfromlangchain.promptsimportPromptTemplatefromlangchain_openaiimportChatOpenAI#分隔列表解析器(CSV解析器)output_pars......