首页 > 数据库 >5分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步

5分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步

时间:2022-12-02 10:34:57浏览次数:64  
标签:同步 PostgreSQL CloudCanal TEXT Greenplum MySQL 迁移

简述

本文主要介绍如何使用 CloudCanal 构建一条 MySQLGreenplum / PostgreSQL 的数据同步链路。

支持版本

源端 MySQL 支持的版本为:5.65.78.X
对端 PostgreSQL 支持的版本为:8.49.09.19.29.3 9.49.59.610.X11.X12.X13.X14.X15.X16.X17.X
对端 Greenplum 支持的版本为:6.X

技术点

流程自动化&功能丰富

支持创建结构迁移、全量迁移、增量同步、数据校验、数据订正类型的任务。结构迁移、全量迁移和增量同步可作为一个任务的多个阶段自动化进行。

新增表自动迁移同步

CloudCanal 提供了修改订阅的能力。对于一个正在运行的增量同步的任务,CloudCanal 提供了动态修改订阅的方式,可以对一个正在运行的增量同步任务新增需要订阅的表。对于新增的表,CloudCanal 会自动迁移、同步其数据。

自定义数据处理

用户在迁移、实时同步期间如需要对传输的数据行进行自定义的加工可以采用 CloudCanal提供的自定义数据处理能力,这对于实时宽表构建、新增动态列、基于微服务、缓存的数据清洗等数据处理场景都非常有帮助。关于更多自定义数据的使用方式可以参考:数据处理插件使用方式

支持多种 DDL

MySQL -> Greenplum / PostgreSQL 链路支持的DDL有 Create TableDrop TableAlter TableRname TableCreate Index

支持高性能写入模式

CloudCanal 中默认采用 PostgreSQL/Greenplum的驱动通过JDBC的方式进行批量写入。如果用户对性能要求很苛刻,可以尝试开启基于Copy模式的高性能写入模式。在Copy写入模式下,写入性能相比采用JDBC的方式有很大的提升。了解基于Copy的高性能写入模式可以参考:开启PG/GP高性能写入

支持地理信息类型写入

PostgreSQLGreenplum对于地理信息类型的处理比较友好,因此常常被用于存储地理信息数据。CloudCanal 支持迁移同步源端地理信息类型的数据并且对其做自动转换后写入对端。了解更多 CloudCanal对于地理信息类型的处理可以参考文章:CloudCanal地理数据同步与处理

结构迁移类型自动处理

异构数据源之间对类型的处理都存在差异,CloudCanal 会进行自动的转化和优化,例如在 MySQL 中可以定义的VARCHAR(0)数据类型,在 PostgreSQL / Greenplum 中不支持,CloudCanal 结构迁移时会自动将源端MySQLVARCHAR(0)类型映射为 VARCHAR(1)

数据类型映射

CloudCanal 结构迁移和数据迁移同步时会自动进行数据类型映射。类型映射见下表:

MySQL 类型 PostgreSQL / Greenplum 类型
BIT BIT
TINYINT SMALLINT
SMALLINT SMALLINT
MEDIUMININT INTEGER
INT INTEGER
BIGINT BIGINT
DECIMAL NUMERIC
FLOAT NUMERIC
DOUBLE NUMERIC
DATE TIMESTAMP WITHOUT TIME ZONE
DATETIME TIMESTAMP WITHOUT TIME ZONE
TIMESTAMP TIMESTAMP WITHOUT TIME ZONE
TIME TIME WITHOUT TIME ZONE
YEAR INTEGER
CHAR CHARACTER
VARCHAR CHARACTER VARYING
BINARY BYTEA
VARBINARY BYTEA
TINYBLOB BYTEA
BLOB BYTEA
MEDIUMBLOB BYTEA
LONGBLOB BYTEA
TINYTEXT BYTEA
TEXT TEXT
MEDIUMTEXT TEXT
LONGTEXT TEXT
ENUM TEXT
SET TEXT
JSON JSON
GEOMETRY� TEXT
POINT� POINT�
LINESTRING� TEXT
POLYGON� POLYGON�
MULTIPOINT� TEXT
GEOMETRY_COLLECTION� TEXT
GEOM_COLLECTION� TEXT
MULTILINESTRING� TEXT

准备工作

  • 安装好 CloudCanal 社区版 2.2.5.10 及以上版本
  • 准备好源端和目标端数据库以及对应的测试数据

操作示例

添加数据源

  • 登录 CloudCanal 平台
  • 数据源管理 -> 新增数据源 -> 自建数据库

image.png

  • 添加 Greenplum 或者 PostgreSQL后可以在数据源列表看到新增的数据源。

image.png

创建同步任务

  • 任务管理 -> 创建任务
  • 源端选择 MySQL 数据源,对端选择 Greenplum / PostgreSQL
  • 分别点击 测试连接,选择源端对端需要订阅的库,选择 下一步

image.png

  • 选择 增量同步 -> 选择 全量初始化
  • 根据自身机器配置选择 规格
  • 选择 下一步

image.png

  • 选择源端需要同步的表,如果目标表显示橙色表示对端不存在该表,任务创建之后,会自动生成该表
  • 点击下一步

image.png

  • 可以在左侧,添加 数据过滤条件
  • 选择 下一步

image.png

  • 选择 创建任务

image.png

任务执行

任务创建并且启动后,会自动进行如下的三个阶段:

  • 结构迁移:任务创建之后,如果对端没有表结构,那么 CloudCanal 会去自动在对端创建表结构
  • 数据初始化:将源端存量数据整体迁移到对端
  • 数据同步:全量迁移期间以及全量完成以后的源端增量数据变更会实时同步到对端

image.png

image.png

总结

本文简单介绍了如何使用 CloudCanal 进行 MySQL -> Greenplum 数据迁移同步。各位读者朋友,如果你觉得还不错,请点赞、评论加转发吧。

标签:同步,PostgreSQL,CloudCanal,TEXT,Greenplum,MySQL,迁移
From: https://www.cnblogs.com/clougence/p/16943630.html

相关文章

  • mysql 备忘
    scdeleteysql2.初始化mysqlmysqld--initialize--console3.初始化后得到初始密码(需要记录初始密码,后续会用到),初始密码为最后一行:'root'@'localhost'':'密码'4.安装mysql......
  • 【MySQL数据割接案例】实现按某个字段分组,再将组内的排序序号更新为排序字段的值
    事情是这样的,原本设计了一个树状结构的目录表,目录下面的节点(类似于文件)有多个类型的。由于原先只考虑一种类型A的数据,因此将目录下目录项的排序维护在了A数据表里,后面扩展......
  • Mysql中文乱码问题(unbutu)
    1.首先查看数据库里面的各种编码格式mysql>showvariableslike"%char%";+--------------------------+---------------+|Variable_name|Value|+--------------------......
  • win10下面部署Mysql数据库
    5.6.24下载地址:​​​http://down10.zol.com.cn/biancgj/mysql_5.6.24_winx64.zip​​下载完成以后解压,在安装目录下面新增my.ini,内容如下:[mysql]#设置mysql客户端默认......
  • mysql8.0使用总结
    1.初始化数据库后,想导入数据,发现报错:ERROR1227(42000)atline75612:Accessdenied;youneed(atleastoneof)theSYSTEM_USERprivilege(s)forthisoperatio......
  • Mysql服务无法启动,服务没有报告任何错误
    场景说明在Window上安装mysql5.7,安装后运行mysql,发现服务无法启动问题解决方法进入mysql的bin目录执行mysqld--initialize-insecure命令第一次执行的话,时间......
  • MySQL NULL--三值逻辑(Three Value Logic)
    三值逻辑(ThreeValueLogic) 对于需求查出含NULL值的数据中,有所有user不等于root的账号: 正确方法一:selectname fromcustomerwhere referee_id!=2or referee......
  • MySQL
    数据库的相关概念DB:数据库(Database)即存储数据的“仓库”,其本质是—个文件系统。它保存了一系列有组织的数据DBMS:数据库管理系统(DatabaseManagementSystem)是一种操......
  • MySQL 常用操作
    环境MySQL 8.01、创建用户及授权创建一个只能查看数据的用户,4条命令搞定。直接上图   关键命令如下mysql-uroot-p//mysql-u{mysql超级用户名}-p//回车......
  • 第三章第2节: 2021.10.28 MySQL设计
            定长存储用char例如身份证号    第二点就是业务用到的库就用业务名                 ......