DataX - [03] 使用案例

时间：2024-12-17 17:58:44浏览次数：4

标签：03 py name mysqlreader writer 案例 DataX reader test

题记部分

001 || mysql2hdfs

（1）查看MySQL被迁移的数据情况

（2）根据需求确定reader为mysqlreader，writer为hdfswriter

查看reader和writer模板的方式（-r读模板；-w写模板）

python bin/datax.py -r mysqlreader -w hdfswriter

（3）编写同步json脚本

（4）确定HDFS上目标路径是否存在

（5）通过datax.py指定json任务运行同步数据

（6）数据验证，查看HDFS上是否已经有MySQL对应表中的所有数据

{
	"job": {
		"content": [
			{
				"reader": {
					"name": "mysqlreader",
					"paramter": {
						"column": ["id","name"],
						"connection": [
							{
								"jdbcUrl": ["jdbc:mysql://xxxxx:3306/dbName"],
								"table": ["test"]
							}
						],
						"password": "twgdhbtzhy",
						"username": "root",
						"splitPk": ""
					}
				},
				"writer": {
					"name": "hdfswriter",
					"parameter": {
						"column": [
							{"name": "id", "type": "bigint"},
							{"name": "name", "type": "string"}
						],
						"compress": "gzip",
						"defaultFS": "hdfs://xxxxx:8020",
						"fieldDelimiter": "\t",
						"fileName": "test",
						"fileType": "text",
						"path": "/test",
						"writeMode": "append"
					}
				}
			}
		],
		"setting": {
			"speed": {
				"channel": "1"
			}
		}
	}
}

（7）任务执行

hdfs dfs -mkdir /test
python bin/datax.py job/mysql2hdfs.json

（8）

002 || 标题

003 || 标题

标签：03,py,name,mysqlreader,writer,案例,DataX,reader,test
From： https://www.cnblogs.com/houhuilinblogs/p/18613143

采集SNMP转profinet IO项目案例
目录1 案例说明 12 VFBOX网关工作原理 13 准备工作 24 配置网关采集SNMP协议数据 25 用PROFINETIO协议转发数据 36 案例总结 61 案例说明设置网关采集SNMP协议设备数据把采集的数据转成profinetIO协议转发给其他系统。2 VFBOX网关工作原理VFBOX网关是协议转换网关，......
1103 欧拉函数
//1103欧拉函数.cpp:此文件包含"main"函数。程序执行将在此处开始并结束。///*http://oj.daimayuan.top/course/22/problem/489输入T，一共T组数据，每组一个数n，输出它的欧拉函数φ(n)。输入格式第一行一个数字T。接下来T行，每行一个数字n。输出格式一共T行，每行一......
湖仓一体所需硬件资源测算案例
存储资源测算数据存储容量估算数据湖部分：与单纯的数据湖存储类似，需要考虑数据的来源、增长速度、数据类型和存储需求差异。包括业务数据、日志文件、物联网数据等多种数据源。对于结构化数据，要考虑其表结构和记录增长；半结构化和非结构化数据则要考虑文件大小和数量的增长。......
题解：B3803 [NICA #1] 上大分
思路看到这道题首先考虑贪心和动态规划。贪心是不行的，因为这里有先减分再加分的数据，也就是说故意在div1的比赛掉分，使得下一次能够打div2加更多的分。我们考虑动态规划，我们用\(f[i][j]\)表示在前\(i\)场比赛中得\(j\)分至少需要打几场比赛，就可以轻易推出这题的转移方......
数据仓库硬件资源测算参考案例
数据存储容量估算数据量增长预估：首先需要考虑数据仓库的数据来源，包括业务系统数据库、日志文件、外部数据等。分析每个数据源的数据增长速度，例如，业务系统中的交易数据可能按照每月10%的速度增长，日志文件数据可能随着用户活动的增加而线性增长。历史数据保留策略：确定需要保留......
预测2025年至2035年间的会消失行业
预测2025年至2035年间，随着科技进步、社会变化、环境压力等因素的发展，部分行业可能会受到极大影响，甚至消失或被大幅缩减。以下是一些可能会逐渐消失或被极大削弱的行业：1. 传统燃油汽车行业随着全球对气候变化和环境保护的重视，越来越多的国家将推动碳排放目标，并加大对电动汽车（EV）......
Caused by ProxyError('Unable to connect to proxy', SSLError(SSLEOFError(8, '[SSL
背景有个网站开了代理，浏览器可以访问，但是命令行ping不通，telnet不通，pythonrequests请求报上述错误解决方案配置代理，改成http请求url="http://m.zhibo8.com/news/web/zuqiu/2024-12-02/match1437755date2024vnative.htm"#替换为实际的网页链接proxies={'http':......
预测2025年至2035年间的需求变化
预测2025年至2035年间的需求变化，可以从多个角度分析，包括科技进步、社会趋势、环境变化和消费行为等因素。以下是一些可能出现的新需求趋势：1. 绿色与可持续发展相关需求随着气候变化问题日益严峻，全球对环保和可持续发展的重视将持续增强，以下是相关需求的潜力：绿色能源与清洁技......
基于STM32F103的数字电压表设计
基于STM32F103的数字电压表设计仿真软件： Proteus8.17编程软件： Keil5仿真实现：使用STM32F103的内部ADC(模数转换器)测量外部电压（用电位器来进行电压的改变），将测量到的电压值显示在数码管上，同事与仿真中的电压表进行对比，误差很小。......
绿色全要素生产率测算代码（SBM模型、超效率SBM模型代码案例数据）
数据介绍：SBM是Slacks-BasedMeasure或SlackBasedMeasure的缩写，一般翻译为基于松弛值测算的模型，与DEA两用，即SBM-DEA。Tone(2001)构建了一个新的DEA模型即SBM（Slacks-BasedMeasure）模型，是一个非径向（non-radial）非角度（non-oriented）DEA模型。“径向的”要求在评价效率时投入或......

DataX - [03] 使用案例

001 || mysql2hdfs

002 || 标题

003 || 标题

相关文章

赞助商

阅读排行