首页 > 数据库 >Canal实现MySQL增量数据的订阅和消费

Canal实现MySQL增量数据的订阅和消费

时间:2023-09-16 15:34:48浏览次数:42  
标签:Canal 订阅 CanalEntry connector instance MySQL entry canal

介绍

canal,译意为水道/管道/沟渠,主要用途是基于 MySQL 数据库增量日志解析,提供增量数据订阅和消费。

canal的工作原理就是把自己伪装成MySQL slave,模拟MySQL slave的交互协议向MySQL Master发送 dump 协议,MySQL mater收到canal发送过来的dump请求,开始推送binary log给canal,然后canal解析binary log,再发送到存储目的地,比如MySQL,Kafka,Elastic Search等。

搭建canal

canal官网

首先要有一个MySQL服务器

可以参考这篇笔记 MySQL搭建主从架构,仅需要配置主机的部分,从机不需要配置,canal作为一个从机。

CREATE USER 'szz'@'%' IDENTIFIED WITH mysql_native_password BY 'pwd1';
GRANT REPLICATION SLAVE,REPLICATION CLIENT ON *.* TO 'szz'@'%';
flush privileges;

注意,配置binlog模式必须配置为row。相比主从配置,多了一个REPLICATION CLIENT权限。

使用docker安装canal

docker pull canal/canal-server:v1.1.4
docker run -d \
--name canal-server \
-p 11111:11111  \
-e canal.instance.master.address=ip:port \
-e canal.instance.mysql.slaveId=1234 \
-e canal.instance.dbUsername=szz \
-e canal.instance.dbPassword=pwd1 \
canal/canal-server:v1.1.4

使用docker安装有问题,运行不起来,具体原因未知

使用jar包运行

wget https://github.com/alibaba/canal/releases/download/canal-1.1.6/canal.deployer-1.1.6.tar.gz

网络原因,最好是下载到windows下,再上传到自己的服务器。

canal.instance.master.address=ip:port
canal.instance.dbUsername=szz
canal.instance.dbPassword=pwd1

编辑配置文件 conf/example/instance.properties

bin/startup.sh

需要配置JAVA_HOME环境变量,启动成功后,会在bin目录下生成canal.pid。
如果出现There is insufficient memory的错误,需要修改startup.sh和restart.sh中的-Xms,-Xmx等启动参数

-Xms128m

java客户端监听

<dependency>
  <groupId>com.alibaba.otter</groupId>
  <artifactId>canal.client</artifactId>
  <version>1.1.6</version>
</dependency>
<dependency>
  <groupId>com.alibaba.otter</groupId>
  <artifactId>canal.protocol</artifactId>
  <version>1.1.6</version>
  <optional>true</optional>
</dependency>
import com.alibaba.otter.canal.client.CanalConnector;
import com.alibaba.otter.canal.client.CanalConnectors;
import com.alibaba.otter.canal.protocol.CanalEntry;
import com.alibaba.otter.canal.protocol.Message;

import java.net.InetSocketAddress;
import java.util.List;

public class TestCanalClient {

    private final static int BATCH_SIZE = 1000;

    public static void main(String[] args) {
        CanalConnector connector = createConnector();
        // 创建链接
        try {
            while (true) {
                // 获取指定数量的数据
                Message message = connector.getWithoutAck(BATCH_SIZE);
                //获取批量ID
                long batchId = message.getId();
                //获取批量的数量
                int size = message.getEntries().size();
                //如果没有数据
                if (batchId == -1 || size == 0) {
                    try {
                        //线程休眠2秒
                        Thread.sleep(2000);
                    } catch (InterruptedException e) {
                        e.printStackTrace();
                    }
                } else {
                    //如果有数据,处理数据
                    printEntry(message.getEntries());
                }
                //进行 batch id 的确认。确认之后,小于等于此 batchId 的 Message 都会被确认。
                connector.ack(batchId);
            }
        } catch (Exception e) {
            e.printStackTrace();
        } finally {
            connector.disconnect();
        }
    }

    /**
     * 打印canal server解析binlog获得的实体类信息
     */
    private static void printEntry(List<CanalEntry.Entry> entrys) {
        for (CanalEntry.Entry entry : entrys) {
            if (entry.getEntryType() == CanalEntry.EntryType.TRANSACTIONBEGIN || entry.getEntryType() == CanalEntry.EntryType.TRANSACTIONEND) {
                //开启/关闭事务的实体类型,跳过
                continue;
            }
            //RowChange对象,包含了一行数据变化的所有特征
            //比如isDdl 是否是ddl变更操作 sql 具体的ddl sql beforeColumns afterColumns 变更前后的数据字段等等
            CanalEntry.RowChange rowChage;
            try {
                rowChage = CanalEntry.RowChange.parseFrom(entry.getStoreValue());
            } catch (Exception e) {
                throw new RuntimeException("ERROR ## parser of eromanga-event has an error , data:" + entry.toString(), e);
            }
            //获取操作类型:insert/update/delete类型
            CanalEntry.EventType eventType = rowChage.getEventType();
            //打印Header信息
            System.out.println(String.format("================》; binlog[%s:%s] , name[%s,%s] , eventType : %s",
                    entry.getHeader().getLogfileName(), entry.getHeader().getLogfileOffset(),
                    entry.getHeader().getSchemaName(), entry.getHeader().getTableName(),
                    eventType));
            //判断是否是DDL语句
            if (rowChage.getIsDdl()) {
                System.out.println("================》;isDdl: true,sql:" + rowChage.getSql());
            }
            //获取RowChange对象里的每一行数据,打印出来
            for (CanalEntry.RowData rowData : rowChage.getRowDatasList()) {
                //如果是删除语句
                if (eventType == CanalEntry.EventType.DELETE) {
                    printColumn(rowData.getBeforeColumnsList());
                    //如果是新增语句
                } else if (eventType == CanalEntry.EventType.INSERT) {
                    printColumn(rowData.getAfterColumnsList());
                    //如果是更新的语句
                } else {
                    //变更前的数据
                    System.out.println("------->; before");
                    printColumn(rowData.getBeforeColumnsList());
                    //变更后的数据
                    System.out.println("------->; after");
                    printColumn(rowData.getAfterColumnsList());
                }
            }
        }
    }

    private static void printColumn(List<CanalEntry.Column> columns) {
        for (CanalEntry.Column column : columns) {
            System.out.println(column.getName() + " : " + column.getValue() + "    update=" + column.getUpdated());
        }
    }

    private static CanalConnector createConnector() {
        CanalConnector connector = CanalConnectors.newSingleConnector(new InetSocketAddress("ip", 11111), "example", "", "");
        //打开连接
        connector.connect();
        //订阅数据库表,全部表
        connector.subscribe(".*\\..*");
        //回滚到未进行ack的地方,下次fetch的时候,可以从最后一个没有ack的地方开始拿
        connector.rollback();
        return connector;
    }
}

源码分析

1.0 canal源码分析简介

参考

超详细Canal入门,看这篇就够了!
canal官网文档
基于Docker结合Canal实现MySQL实时增量数据传输

标签:Canal,订阅,CanalEntry,connector,instance,MySQL,entry,canal
From: https://www.cnblogs.com/strongmore/p/17131246.html

相关文章

  • 4-MySQL数据库的常用操作
    在MySQL数据库中,增删改查操作是指对数据进行添加、删除、查询和修改的操作。这些操作在数据库管理和维护中非常重要,可以帮助数据库管理员和开发人员有效地管理数据和实现各种复杂的数据处理需求。添加数据(增加操作):在MySQL中,添加数据通常使用INSERT语句。通过INSERT语句,开发人员可......
  • 3-MySQL基本数据类型介绍
    数据类型的介绍:数据类型(data_type)是指系统中所允许的数据的类型。数据库中的每个列都应有适当的数据类型,用于限制或允许该列中存储的数据。例如,列中存储的为数字,则相应的数据类型应该为数值类型。如果使用错误的数据类型可能会严重影响应用程序的功能和性能,所以在设计表时,应该特......
  • mysql初始密码是什么
    MySQL初始密码是什么?对于刚开始使用MySQL的用户来说,这是一个常见的问题。实际上,MySQL的初始密码是空的。在使用MySQL之前,我们需要首先创建一个root账户。在Windows系统中,我们可以使用命令行操作mysql,打开cmd命令行窗口,输入mysql-uroot-p,然后按回车键。这时候我们需要输入初始密码......
  • 2-MySQL基本语法
    上文说到,数据库的安装和连接,接下来将给大家讲解MySQL数据库的基本语法及数据的类型1.基本语法(1).查看当前所有数据库:showdatabases;(2).创建数据库createdatabase数据库名;例如:createdatabasegzy;(3).如果不确定数据库是否存在,应在创建之前加上判断,如果不存在则创建[]......
  • mysql 索引概念、定义和使用
    MySQL索引是一种用于提高数据库查询性能的数据结构。它可以加快数据的检索速度,减少数据库查询的时间复杂度。概念:索引是基于表中一个或多个列的值创建的数据结构。它类似于书籍的目录,可以快速定位到包含所需数据的页面或数据块,而无需扫描整个表。定义:在MySQL中,可以通过以下方式......
  • MySQL 表分区简介
    MySQL表分区是一种数据库管理技术,用于将大型表拆分成更小、更可管理的分区(子表)。每个分区可以独立进行维护、备份和查询,从而提高数据库性能和管理效率。以下是详细介绍MySQL表分区的步骤和注意事项:步骤1:选择分区列首先,你需要选择一个适当的列作为分区键(PartitionKey),根据这个列......
  • 1-MySQL数据库的安装和基础语法介绍
    1.MySQL是什么?MySQL是一个关系型数据库管理系统,由瑞典MySQLAB公司开发,属于Oracle旗下产品。它是最流行的关系型数据库管理系统之一,在WEB应用方面,MySQL是最好的RDBMS(RelationalDatabaseManagementSystem,关系数据库管理系统)应用软件之一。关系数据库将数据保存在不......
  • MySQL——基本使用
    基本操作SQL语句分类DDL:数据定义语句【create表,库...】DML:数据操作语句【增删改】DQL:数据查询语句【select】DCL:数据控制语句【管理数据库:比如用户权限grant、revoke】列类型(常用)数值型:TINYINT[UNSIGNED]——1byte,默认有符号INT——4byteBIGINT——8byteFLOAT——4byte......
  • MySQL——事务
    是什么必须被原子地执行的一个或多个数据库操作的集合,事务用于保证数据的一致性。如:转账就要用事务来处理,用以保证数据的一致性。当执行事务操作时,mysql会在表上加锁,防止其他操作对表进行修改。事务的特性ACID原子性Atomicity一致性Consistency隔离性Isolation持久性Durabi......
  • MySQL——存储引擎
    mysql表类型和存储引擎开发中需要根据需求选择存储引擎。MySQL的表类型由存储引擎决定,常用的包括MylSAM、InnoDB、Memory等。这六种又分为两类,一类是“事务安全型”(transaction-safe),比如:InnoDB;其余都属于第二类,称为”非事务安全型”(non-transaction-safe),比如mysiam和memory。......