首页 > 其他分享 >DataX(一):DataX简介

DataX(一):DataX简介

时间:2024-07-27 21:27:21浏览次数:6  
标签:同步 20 简介 TaskGroup 并发 DataX 数据源

1. 什么是 DataX

DataX 是阿里巴巴开源的一个异构数据源离线同步工具,致力于实现包括关系型数据 库(MySQL、Oracle 等)、HDFS、Hive、ODPS、HBase、FTP 等各种异构数据源之间稳定高 效的数据同步功能。

2. DataX 的设计

为了解决异构数据源同步问题,DataX 将复杂的网状的同步链路变成了星型数据链路, DataX 作为中间传输载体负责连接各种数据源。当需要接入一个新的数据源的时候,只需要 将此数据源对接到 DataX,便能跟已有的数据源做到无缝数据同步。

3. 支持的数据源

DataX 目前已经有了比较全面的插件体系,主流的 RDBMS 数据库、NOSQL、大数据计算系统都已经接入。

4. 框架设计

5. 运行原理

举例来说,用户提交了一个 DataX 作业,并且配置了 20 个并发,目的是将一个 100 张 分表的 mysql 数据同步到 odps 里面。 DataX 的调度决策思路是:

1)DataXJob 根据分库分表切分成了 100 个 Task。

2)根据 20 个并发,DataX 计算共需要分配 4 个 TaskGroup(这里的4表示20(并发数)/5(每个TaskGroup并发数量)= 4)。

3)4 个 TaskGroup 平分切分好的 100 个 Task,每一个 TaskGroup 负责以 5 个并发共计运 行 25 个 Task。

6. 与 Sqoop 的对比

标签:同步,20,简介,TaskGroup,并发,DataX,数据源
From: https://blog.csdn.net/zuodingquan666/article/details/140741433

相关文章

  • KALI LINXU简介
    KaliLinux,这个名字听起来是不是有点像是来自遥远星球的神秘语言?哈哈,其实它是一种非常酷的操作系统,专门为网络安全和渗透测试设计的。下面,就让我来给你介绍一下这个神奇的KaliLinux吧!什么是KaliLinux?KaliLinux,基于DebianLinux,是一个开源的操作系统,由OffensiveSecurity的......
  • 缓存的简介以及Mybatis缓存中一级缓存和二级缓存
    简介我们所有的查询都需要连接数据库,连接数据库比较耗资源,那么如何解决耗资源的问题呢?    我们可以把一次查询的结果暂存在一个可以直接取到的地方——>内存    放在内存里的这一些查询的数据就叫缓存,这是什么意思呢,我们再次查询相同数据的时     ......
  • 2024年最新STM32单片机简介
    一、STM32简介    STM32是ST公司基于ARMCortex-M内核开发的32位微控制器。    STM32常应用在嵌入式领域,如智能车、无人机、机器人、无线通信、物联网、工业控制、娱乐电子产品等。    STM32功能强大、性能优异、片上资源丰富、功耗低,是一款经典的......
  • 深度学习1-简介
    人工智能(AI)旨在打造模仿智能行为的系统。它覆盖了众多方法,涵盖了基于逻辑、搜索和概率推理的技术。机器学习是AI的一个分支,它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展,现在几乎(虽不完全准确)与AI同义。深度神经网络是一类机器学习模型,将其......
  • 音视频入门基础:WAV专题(2)——WAV格式简介
    注:本文有部分内容引用了维基百科:https://zh.wikipedia.org/wiki/WAV一、引言WaveformAudioFileFormat(缩写WAVE或WAV)是微软与IBM公司所开发在个人电脑存储音频流的编码格式,在Windows平台的应用软件受到广泛的支持。此格式属于资源交换文件格式(RIFF)的应用之一(关于RIFF格......
  • 无人驾驶核心技术简介
    1.1核心技术无人驾驶技术依赖于多种核心技术的协同工作,这些技术共同构建了一个复杂而高效的自动驾驶系统。以下是无人驾驶技术的主要核心技术:1.传感器技术2.人工智能与机器学习3.高精度地图与导航4.车载计算平台与软件系统1.1.1传感器技术传感器技术是无人驾驶技术......
  • CBR云备份与恢复管控简介
    本文分享自天翼云开发者社区《CBR云备份与恢复管控简介》,作者:c****n1.CBR云备份与恢复介绍CBR(CloudBackup&Restore)是一般云厂商提供的备份与恢复服务。用户可以在云端对数据进行备份和恢复,保证数据的安全性和可靠性。使用CBR,用户可以方便地随时随地备份和恢复数据。采用......
  • Java简介及JDK的安装
    一、JAVA语言概述1.java语言的发展Java的开发者为詹姆斯·高斯林。转至sun公司,后参与“绿色计划”,发展了一套语言“Oak”,之后改名为Java(爪蛙)。2.Java语言的平台版本JavaSE标准版本:为普通开发桌面和商务应用程序提供的解决方案;此技术为后两项的基础,可以完成一些桌面的开发。......
  • 西安理工大学机器人NEXT-E战队 视觉组简介和24届新生暑假自学指引
    视觉组简介和24届新生暑假自学指引1.视觉组是什么RoboMaster机器人竞赛作为一个竞技机器人赛事,利用弹丸攻击对方机器人或对方场地道具装甲板是取得胜利的关键。为了更好的进行打击,仅依靠操作手的手动瞄准是远远不够的,因此。视觉组利用各类算法,开发出稳定的自动瞄准系统,能够极......
  • 鸿蒙HarmonyOS【应用开发一、鸿蒙简介】
    ✍️作者简介:小北编程(专注于HarmonyOS、Android、Java、Web、TCP/IP等技术方向)......