• 2024-03-01CloudCanal x Hive 构建高效的实时数仓
    简述CloudCanal最近对于全周期数据流动进行了初步探索,打通了Hive目标端的实时同步,为实时数仓的构建提供了支持,这篇文章简要做下分享。基于临时表的增量合并方式基于HDFS文件写入方式临时表统一Schema任务级的临时表基于临时表的增量合并方式Hive目标端写入方式和
  • 2024-01-19用 CloudCanal 做跨互联网数据库双向同步
    简介CloudCanal推出跨互联网安全数据同步方案之后,有一些商业客户落地,效果良好,不过客户也反馈了一些改进和新需求,其中最大的一个需求即双向同步防循环。近期CloudCanal版本支持了这个特性,整体方案进一步升级,最大特点包括:两端数据库完全不开放公网端口两端数据库可双向同
  • 2023-12-21CloudCanal x Debezium 打造实时数据流动新范式
    简述Debezium是一个开源的数据订阅工具,主要功能为捕获数据库变更事件发送到Kafka。CloudCanal近期实现了从Kafka消费Debezium格式数据,将其同步到StarRocks、Doris、Elasticsearch、MongoDB、ClickHouse等12种数据库和数仓,补全其数据到达能力。本文将先简单介绍该项
  • 2023-12-21CloudCanal x Debezium 打造实时数据流动新范式
    简述Debezium是一个开源的数据订阅工具,主要功能为捕获数据库变更事件发送到Kafka。CloudCanal近期实现了从Kafka消费Debezium格式数据,将其同步到StarRocks、Doris、Elasticsearch、MongoDB、ClickHouse等12种数据库和数仓,补全其数据到达能力。本文将先简单介绍该项
  • 2023-11-17花 200 元测试 1300 个实时数据同步任务
    背景对于将数据作为重要生产资料的公司来说,超大规模的数据迁移同步系统(1k、5k、10k条同步任务)是刚需。本文以此为出发点,介绍近期CloudCanal所做的一个容量测试:在单个CloudCanal集群上创建1300实时任务,验证系统是否健康。这个健康度主要包括同步任务是否运行正常、页
  • 2023-11-03一镜到底 ElasticSearch 数据迁移同步技术
    ##简介[CloudCanal](https://www.clougence.com?kw=51cto_20231103)对于[Elasticsearch](https://www.elastic.co/)的支持经历了很多轮迭代,版本一路从6.x,7.x支持到8.x版本,也适配了其纷繁多样的API。因为Elasticsearch是一个相当流行的、实时的、并且具备一定不可替代能
  • 2023-11-03一镜到底 ElasticSearch 数据迁移同步技术
    简介CloudCanal对于Elasticsearch的支持经历了很多轮迭代,版本一路从6.x,7.x支持到8.x版本,也适配了其纷繁多样的API。因为Elasticsearch是一个相当流行的、实时的、并且具备一定不可替代能力的搜索引擎,所以很有必要对比下市面上我们能够比较容易获得的、免费的数据迁移
  • 2023-07-21CloudCanal 数据脱敏实践
    简述本文主要介绍使用CloudCanal做数据迁移同步时如何对特定数据做脱敏处理。技术点自定义代码CloudCanal允许用户上传业务代码到数据任务中,完成数据迁移、同步过程中数据处理的目的。数据同步脱敏也是基于自定义代码实现,具备以下特点:脱敏范围灵活,可选择任何一个或多个
  • 2023-04-27CloudCanal x OceanBase 数据迁移同步优化
    简述CloudCanal去年支持OceanBase数据迁移同步能力后,随着使用用户增多以及问题反馈,近期对该能力进行了一轮较大规模的优化。本篇文章简要介绍这些优化点,以及未来该能力的演进方向。优化点大幅提升同步性能CloudCanal目前使用OceanBaseLogProxy做增量数据订阅,使用方式
  • 2023-03-31CloudCanal 落地 DB2 数据迁移同步功能
    简述Db2是一款具有悠久历史的关系型数据库,由IBM公司开发和维护,广泛应用于金融级业务场景。CloudCanal近期提供了Db2为源端的数据迁移同步功能,用户可以便利地将Db2中数据实时同步到其他数据库,实现数据更广泛、更实时的应用。功能介绍目标数据库和能力目标端数据源
  • 2023-01-13CloudCanal实战-Oracle数据迁移同步到PostgreSQL
    简述本篇文章主要介绍如何使用CloudCanal构建一条Oracle到PostgreSQL的数据同步链路技术要点缩小的数据库权限要求CloudCanal对Oracle数据库的高权限要求,主要
  • 2022-12-30CloudCanal对Online DDL 工具 GH-OST 和 PT-OSC 的支持
    简介CloudCanal实现了对OnlineDDL工具如GH-OST和PT-OSC的支持,保证了对端实时同步源端的OnlineDDL操作。本文以MySQL->MySQL同步链路使用GH-OST为例,介绍
  • 2022-12-30CloudCanal对Online DDL 工具 GH-OST 和 PT-OSC 的支持
    简介CloudCanal实现了对OnlineDDL工具如GH-OST和PT-OSC的支持,保证了对端实时同步源端的OnlineDDL操作。本文以MySQL->MySQL同步链路使用GH-OST为例,介绍
  • 2022-12-23CloudCanal实战-五分钟搞定Oracle到StarRocks数据迁移与同步
    简述CloudCanal当前最新版本已经支持源端Oracle、SqlServer等主流传统数据库作为源端迁移同步数据到StarRocks来构建实时数仓。本文简要介绍如何快速构建一条Oracle->Star
  • 2022-12-025分钟搞定 MySQL 到 Greenplum / PostgreSQL 数据迁移同步
    简述本文主要介绍如何使用CloudCanal构建一条MySQL到Greenplum/PostgreSQL的数据同步链路。支持版本源端MySQL支持的版本为:5.6、5.7、8.X对端PostgreSQL支
  • 2022-11-045分钟搞定 PostgreSQL 到 Doris 数据迁移和同步
    简述ApacheDoris是一个现代化的MPP分析型数据库产品,仅需亚秒级响应时间即可获得查询结果,能有效地支持实时数据分析。本文主要介绍如何使用CloudCanal快速构建一
  • 2022-10-18如何利用现代化数据栈高效处理地理信息数据
    背景知识什么是地理信息数据地理信息数据的定义主要来自于我们熟知的星球——地球。我们知道地球表面是一个凸凹不平的表面,是一个近似的椭球体。以海平面为参照已知最高点和
  • 2022-10-17如何利用现代化数据栈高效处理地理信息数据
    背景知识什么是地理信息数据地理信息数据的定义主要来自于我们熟知的星球——地球。我们知道地球表面是一个凸凹不平的表面,是一个近似的椭球体。以海平面为参照已知最高
  • 2022-08-30CloudCanal x StarRocks 在医疗大健康实时数仓领域的落地与实践
    -#简述本案例为国内某大健康领域头部公司真实案例(因用户保密要求,暂不透露用户相关信息)。希望文章内容对各位读者使用CloudCanal构建实时数仓带来一些帮助。 #业
  • 2022-08-305分钟搞定 关系型数据库 到 Flink 数据同步
    简述实时数据处理领域中,使用Flink方式,除了从日志服务订阅埋点数据外,总离不开从关系型数据库订阅并处理相关业务数据,这时就需要监测并捕获数据库增量数据,将变更按发生的
  • 2022-08-305分钟搞定MySQL/PostgreSQL/Oracle到StarRocks数据迁移同步-CloudCanal实战
    ##简述CloudCanal2.1.0.x版本开始支持StarRocks作为对端的数据迁移同步能力本文通过MySQL->StarRocks的数据迁移同步案例简要介绍这个源端的能力。链路特点:-结