首页 > 其他分享 >DataX - [03] 使用案例

DataX - [03] 使用案例

时间:2024-12-17 17:58:44浏览次数:4  
标签:03 py name mysqlreader writer 案例 DataX reader test

题记部分

 

001 || mysql2hdfs

(1)查看MySQL被迁移的数据情况

(2)根据需求确定reader为mysqlreader,writer为hdfswriter

查看reader和writer模板的方式(-r读模板;-w写模板)

python bin/datax.py -r mysqlreader -w hdfswriter

(3)编写同步json脚本

(4)确定HDFS上目标路径是否存在

(5)通过datax.py指定json任务运行同步数据

(6)数据验证,查看HDFS上是否已经有MySQL对应表中的所有数据

{
	"job": {
		"content": [
			{
				"reader": {
					"name": "mysqlreader",
					"paramter": {
						"column": ["id","name"],
						"connection": [
							{
								"jdbcUrl": ["jdbc:mysql://xxxxx:3306/dbName"],
								"table": ["test"]
							}
						],
						"password": "twgdhbtzhy",
						"username": "root",
						"splitPk": ""
					}
				},
				"writer": {
					"name": "hdfswriter",
					"parameter": {
						"column": [
							{"name": "id", "type": "bigint"},
							{"name": "name", "type": "string"}
						],
						"compress": "gzip",
						"defaultFS": "hdfs://xxxxx:8020",
						"fieldDelimiter": "\t",
						"fileName": "test",
						"fileType": "text",
						"path": "/test",
						"writeMode": "append"
					}
				}
			}
		],
		"setting": {
			"speed": {
				"channel": "1"
			}
		}
	}
}

(7)任务执行

hdfs dfs -mkdir /test
python bin/datax.py job/mysql2hdfs.json

(8)

 

 

 

 

002 || 标题

 

 

003 || 标题

 

 

标签:03,py,name,mysqlreader,writer,案例,DataX,reader,test
From: https://www.cnblogs.com/houhuilinblogs/p/18613143

相关文章

  • 采集SNMP转profinet IO项目案例
    目录1 案例说明 12 VFBOX网关工作原理 13 准备工作 24 配置网关采集SNMP协议数据 25 用PROFINETIO协议转发数据 36 案例总结 61 案例说明设置网关采集SNMP协议设备数据把采集的数据转成profinetIO协议转发给其他系统。2 VFBOX网关工作原理VFBOX网关是协议转换网关,......
  • 1103 欧拉函数
    //1103欧拉函数.cpp:此文件包含"main"函数。程序执行将在此处开始并结束。///*http://oj.daimayuan.top/course/22/problem/489输入T,一共T组数据,每组一个数n,输出它的欧拉函数φ(n)。输入格式第一行一个数字T。接下来T行,每行一个数字n。输出格式一共T行,每行一......
  • 湖仓一体所需硬件资源测算案例
    存储资源测算数据存储容量估算数据湖部分:与单纯的数据湖存储类似,需要考虑数据的来源、增长速度、数据类型和存储需求差异。包括业务数据、日志文件、物联网数据等多种数据源。对于结构化数据,要考虑其表结构和记录增长;半结构化和非结构化数据则要考虑文件大小和数量的增长。......
  • 题解:B3803 [NICA #1] 上大分
    思路看到这道题首先考虑贪心和动态规划。贪心是不行的,因为这里有先减分再加分的数据,也就是说故意在div1的比赛掉分,使得下一次能够打div2加更多的分。我们考虑动态规划,我们用\(f[i][j]\)表示在前\(i\)场比赛中得\(j\)分至少需要打几场比赛,就可以轻易推出这题的转移方......
  • 数据仓库硬件资源测算参考案例
    数据存储容量估算数据量增长预估:首先需要考虑数据仓库的数据来源,包括业务系统数据库、日志文件、外部数据等。分析每个数据源的数据增长速度,例如,业务系统中的交易数据可能按照每月10%的速度增长,日志文件数据可能随着用户活动的增加而线性增长。历史数据保留策略:确定需要保留......
  • 预测2025年至2035年间的会消失行业
    预测2025年至2035年间,随着科技进步、社会变化、环境压力等因素的发展,部分行业可能会受到极大影响,甚至消失或被大幅缩减。以下是一些可能会逐渐消失或被极大削弱的行业:1. 传统燃油汽车行业随着全球对气候变化和环境保护的重视,越来越多的国家将推动碳排放目标,并加大对电动汽车(EV)......
  • Caused by ProxyError('Unable to connect to proxy', SSLError(SSLEOFError(8, '[SSL
    背景有个网站开了代理,浏览器可以访问,但是命令行ping不通,telnet不通,pythonrequests请求报上述错误解决方案配置代理,改成http请求url="http://m.zhibo8.com/news/web/zuqiu/2024-12-02/match1437755date2024vnative.htm"#替换为实际的网页链接proxies={'http':......
  • 预测2025年至2035年间的需求变化
    预测2025年至2035年间的需求变化,可以从多个角度分析,包括科技进步、社会趋势、环境变化和消费行为等因素。以下是一些可能出现的新需求趋势:1. 绿色与可持续发展相关需求随着气候变化问题日益严峻,全球对环保和可持续发展的重视将持续增强,以下是相关需求的潜力:绿色能源与清洁技......
  • 基于STM32F103的数字电压表设计
    基于STM32F103的数字电压表设计仿真软件:      Proteus8.17编程软件:      Keil5仿真实现:      使用STM32F103的内部ADC(模数转换器)测量外部电压(用电位器来进行电压的改变),将测量到的电压值显示在数码管上,同事与仿真中的电压表进行对比,误差很小。......
  • 绿色全要素生产率测算代码(SBM模型、超效率SBM模型代码案例数据)
    数据介绍:SBM是Slacks-BasedMeasure或SlackBasedMeasure的缩写,一般翻译为基于松弛值测算的模型,与DEA两用,即SBM-DEA。Tone(2001)构建了一个新的DEA模型即SBM(Slacks-BasedMeasure)模型,是一个非径向(non-radial)非角度(non-oriented)DEA模型。“径向的”要求在评价效率时投入或......