首页 > 其他分享 >提升数据决策时效,火山引擎DataLeapCDC分库分表能力升级!

提升数据决策时效,火山引擎DataLeapCDC分库分表能力升级!

时间:2023-10-19 10:58:26浏览次数:33  
标签:分库 缓存 DataLeapCDC CDC 同步 分表 数据

更多技术交流、求职机会,欢迎关注字节跳动数据平台微信公众号,回复【1】进入官方交流群
  近日,大数据研发治理套件DataLeap数据集成更新CDC分库分表能力,可做到将多个实例的多个数据库的多个分表同步到目标端的一个表中,先离线同步,然后实时同步。适用于分库分表场景。同时,支持将 MySQL 同步到EMR-Doris、EMR-Starrocks、LAS,助力将最新的数据以最快且最低的带宽成本同步到目标库,辅助业务数据分析准确、提效   CDC(Change Data Capture)是变更数据获取的简称。可以基于增量日志,以极低的侵入性来完成增量数据捕获的工作。核心思想是,监测并捕获数据库的变动(包括数据或数据表的插入、更新以及删除等),将这些变更按发生的顺序完整记录下来,可以直接写入到消息中间件中以供其他服务进行订阅及消费,也可以直接对接其他数据源做业务或者数据分析&应用。   相比批量抽取的优势 与批量同步相比,变更数据的捕获通常具有如下三项基本优势:
  • CDC通过仅发送增量的变更,来降低通过网络传输数据的成本
  • CDC可以帮助用户根据最新的数据做出更快、更准确的决策。例如,CDC会将事务直接传输到专供分析的应用上
  • CDC最大限度地减少了对于生产环境网络流量的干扰。
  实时同步解决方案目前支持以下两种方案:
  1. 实时整库方案即支持将一个数据库下的多张schema不同的表在一个解决方案中分别同步到目标端的不同表中。先离线同步,然后实时同步。当前支持 MySQL、PostGreSQL、SQLsever同步到EMR-Doris、StarRocks、LAS
  2. 实时分库分表方案:在整库方案基础上,更进一步支持将schema相同的多个实例的多个数据库的多个分表同步到目标端的一个表中。先离线同步,然后实时同步。适用于分库分表场景。当前支持 MySQL同步到 EMR-Doris、StarRocks、LAS。支持直连同步,也支持中间缓存到后kafka后再同步
  灵活的中间件缓存同步模式、极大提高数据消费灵活性 缓存配置目前支持“使用缓存”、“无需缓存,直接同步”这两种缓存配置方式。使用Kafka缓存需要在数据来源配置时绑定对应的CDC采集数据进入的Kafka。使用缓存:可通过使用 Kafka 缓存来采集源端数据,这种方式需要额外配置 Kafka 数据源,并且已为对应的 Kafka 实例,创建了相应的 CDC 数据订阅采集任务,将源端 MySQL 中的数据,实时采集到 Kafka 实例中。无需缓存,直接同步:通过直接采集 MySQL Binlog 日志,进行数据实时读取。   客户价值 通过快速连接云下自建/云上数据源进行数据采集同步等,帮助客户连接各类数据上云,以及云上数据流动,轻松完成数据入仓入湖,有效发挥数据的价值。借助CDC分库分表同步,支持数据端到端快速同步,数据实时性得到进一步增强,业务决策时效性提高且更准确。   点击跳转大数据研发治理套件 DataLeap了解更多

标签:分库,缓存,DataLeapCDC,CDC,同步,分表,数据
From: https://www.cnblogs.com/bytedata/p/17774200.html

相关文章

  • Mysql分表后同结构不同名称表之间复制数据以及Update语句只更新日期加减不更改时间
    场景SpringBoot+Mybatis+定时任务实现大数据量数据分表记录和查询:SpringBoot+Mybatis+定时任务实现大数据量数据分表记录和查询_mybatis定时任务创建日表_霸道流氓气质的博客通过以上分表实现的同结构不同表名之间的表,如何将一个表中的数据复制到另一个表中,且将日期字段进行同样的......
  • 分库和集群方案
          ......
  • 数据库的分区和分表
          ......
  • TiDB恢复部分表的方式方法
    TiDB恢复部分表的方式方法背景今天同事告知误删了部分表.因为是UAT准生产的环境,所以仅有每天晚上11点的备份处理.同时告知昨天的数据也可以.得到认可后进行了TiDB的单表备份恢复.备份的语句注意TiDB是可以增量备份恢复的但是为了快速的恢复和解决背景中的问题.......
  • sharding-jdbc分库分表
    数据库分片思想垂直切分按照业务拆分的方式称为垂直分片,又称为纵向拆分,它的核心理念是专库专用。水平切分水平分片又称为横向拆分。相对于垂直分片,它不再将数据根据业务逻辑分类,而是通过某个字段(或某几个字段),根据某种规则将数据分散至多个库或表中,每个分片仅包含数据的一部分。例......
  • Sharding-JDBC教程:Spring Boot整合Sharding-JDBC实现分库分表+读写分离
    在工程的application中做sharding-jdbc的分库分表配置,代码如下:sharding.jdbc.datasource.names=ds-master-0,ds-master-1,ds-master-0-slave-0,ds-master-0-slave-1,ds-master-1-slave-0,ds-master-1-slave-1sharding.jdbc.datasource.ds-master-0.type=com.alibaba.dr......
  • 使用Sharding-JDBC 分库分表
    当mysql单表数据量比较大时往往需要分库分表,Sharding-JDBC是当当网开源的数据库分库分表中间件。Sharding-JDBC定位为轻量级java框架,使用客户端直连数据库,以jar包形式提供服务,无proxy代理层,无需额外部署,无其他依赖,DBA也无需改变原有的运维方式。本文主要讲述该框架与spring+mybatis......
  • springboot -- 整合 sharding-jdbc 读写分离+分库分表配置(进阶)
    sharding-jdbc说明:1、分库分表不能中途更改,取模算法的id会出错2、不支持特殊sql,包括去重,子sql,聚合等3、查询会给所有表发查询sql,带上分库,分表的字段的查询只发一条,4、查询数据要注意使用,尽量带上分库或分表字段来查询,避免多表查询sql过多取模算法假设2个表,test_0,test_1,分......
  • java——mysql随笔——运维——分库分表&MyCat
    分库分表:                    介绍:                    拆分方式:                                     ......
  • 记录一次使用MP的TableNameHandler实现简单的分表需求
    1.使用场景MybatisPlus3.4.0及以上版本有简单的分表需求,项目不允许嵌入其他分库分表框架2.具体使用2.1TableNameHandler介绍TableNameHandler是MP提供的一个动态表名处理接口,其原理是通过MP拓展的拦截器(DynamicTableNameInnerInterceptor)中动态修改解析完成后的sql中的......