首页 > 数据库 >Dinky的使用——snappy2mysql

Dinky的使用——snappy2mysql

时间:2022-10-19 11:23:36浏览次数:57  
标签:Dinky STRING snappy2mysql flink snappy 使用 table orc name

需求:将压缩文件snappy的数据同步到mysql数据库

snappy可以作为orc文件的压缩格式存在,所以在添加依赖包的时候,直接添加orc的依赖包就可以了

还有一点注意的是,在创建hive表的时候,指明snappy压缩

下面是一个hive建表举例

create table stu_orc(id int,name string)
stored as orc 
tblproperties ('orc.compress'='snappy');

 

 

一、添加依赖包

在dinky的plugins目录和flink的lib目录下,添加orc依赖jar包,并重启dinky和flink

下载地址参考:https://www.bookstack.cn/read/ApacheFlink-1.13-zh/6f9399b3e1a8dd04.md

再次提醒,下载的时候注意flink的版本,要跟自己的flink版本匹配

 

二、创建作业

 

 

 

 

三、编写flinksql代码

我这里提前准备好snappy压缩文件,提前创建Hive的snappy表,并插入数据,hdfs上下载好snappy格式的数据文件

CREATE TABLE fs_table (
`id` STRING,
`name` STRING,
`sex` STRING,
`age` STRING,
`work` STRING
)  WITH (
  'connector'='filesystem',
  'path'='/home/data/snappy',
  'format'='orc'
);

CREATE TABLE snappy_out( 
`id` STRING,
`name` STRING,
`sex` STRING,
`age` STRING,
`work` STRING
) WITH (
  'connector' = 'jdbc', 
  'url' = 'jdbc:mysql://172.16.119.50:3306/test?createDatabaseIfNotExist=true&useSSL=false',
  'username' = 'root',
  'password' = 'Tj@20220710', 
  'table-name' = 'snappy_out' 
);

INSERT INTO snappy_out select id,name,sex,age,work from fs_table;

 

 

四、运行作业

检测sql语句没有语法问题后,选定提前部署的flink集群,直接运行作业

 

 

 

 

运行成功

 

 

 

查看mysql表的数据,确认数据是否同步过来

 

标签:Dinky,STRING,snappy2mysql,flink,snappy,使用,table,orc,name
From: https://www.cnblogs.com/braveym/p/16805562.html

相关文章

  • plopjs 的基础使用方法
    constfs=require('fs');constpath=require('path');constactionsall=fs.readFileSync(path.resolve(__dirname,'./commitApps.txt'),'utf-8');constnameDi......
  • 在FinClip中如何使用小程序插件?
    最近总发现很多萌新把小程序插件和小程序组件搞混淆。简单来说,组件和插件的区别在于,插件是可以直接提供服务的,组件是给开发者的轮子提高开发效率的,这是两回事。小程序插件是......
  • 【转行测试开发-redis】(五)---使用redis的数据类型列表list
    昨天讲了使用java里maven配置redis来连接redis数据库,操作并获取数据库中的值.今天我们来说下另一个常用的数据类型---列表list  Redis列表是简单的字符串列表,按照插入顺......
  • Windows使用Docker出现exit 139错误
    使用DockerDesktop启动一个镜像以后,发现直接EXITED(139)这时候用dockerlogcontainerId也获取不到任何日志问题缘由找了比较多的资料哈,Centos6下对Docker支持确实......
  • docker使用-01镜像管理
    安装dockerhttps://dockerdocs.cn/get-docker/构建第一个镜像1.创建flask应用fromflaskimportFlaskapp=Flask(__name__)@app.route('/')deftest():re......
  • 使用 TensorFlow 和 Express.js 实现AI图像识别
    人工智能是一个相当广泛的领域,以其惊人的能力和复杂的性质吸引着人们的兴趣。自1940年代首次提出使用电子设备重建大脑的可能性以来,这项技术已经取得了长足的进步。尽管人......
  • 使用DataX将oracle中的数据同步到MySQL
    1.环境准备(1).在oracle上创建表及数据createtableORACLE_DATAX1(user_codeVARCHAR2(20)notnull,user_nameVARCHAR2(50));insertintoORACLE_DATAX1(user_code,......
  • ansible搭建基本使用
    一、安装ansible配置yum源RHEL/CentOS6:#yuminstallhttps://dl.fedoraproject.org/pub/epel/epel-release-latest-6.noarch.rpmRHEL/CentOS7:#yuminstallh......
  • katex1-初步使用
    安装和使用csdn和npm均可<!DOCTYPEhtml><htmllang="en"><head><metacharset="UTF-8"/><metahttp-equiv="X-UA-Compatible"content="IE=edge"/>......
  • linux—— 使用gcc解析程序四个阶段
    (文章目录)一、gcc1.gcc的安装yum-yinstallgcc-c++autoconfpcrepcre-develmakeautomakeyum-yinstallwgethttpd-toolsvim2.gcc的默认使用[yzq@VM-8-8......