首页 > 数据库 >Dinky的使用——parquet2mysql

Dinky的使用——parquet2mysql

时间:2022-10-19 14:12:29浏览次数:38  
标签:parquet2mysql Dinky STRING mysql flink 使用 sex parquet name

 需求:将parquet数据文件同步数据到mysql数据库

需要通过创建parquet格式的hive表,从hdfs中将数据文件下载,我这里提前做好了

 

一、添加依赖包

在dinky的plugins目录和flink的lib目录下添加parquet文件格式的依赖包,并重启dinky和flink

依赖包下载地址参考:https://www.bookstack.cn/read/ApacheFlink-1.13-zh/d8d654b36a91abf4.md

下载的时候大家注意自己的flink版本

 

二、创建作业

 

 

 

 三、编写flinksql代码

 

CREATE TABLE fs_table (
`id` STRING,
`name` STRING,
`sex` STRING,
`age` INT,
`work` STRING
)  WITH (
  'connector'='filesystem',
  'path'='/home/data/parquet',
  'format'='parquet'
);

CREATE TABLE par_out( 
`id` STRING,
`name` STRING,
`sex` STRING,
`age` INT,
`work` STRING
) WITH (
  'connector' = 'jdbc', 
  'url' = 'jdbc:mysql://172.16.119.50:3306/test?createDatabaseIfNotExist=true&useSSL=false',
  'username' = 'root',
  'password' = 'Tj@20220710', 
  'table-name' = 'par_out' 
);

INSERT INTO par_out select id,name,sex,age,work from fs_table;

 

 

 

 

四、运行作业

选定好提前部署的flink集群,并通过sql代码的检查没问题就可以运行

 

 

 

 

运行成功

 

 

也可以通过flink页面观察作业运行情况 

 

 

 

 

查看mysql表,确认数据是否同步过来

 

标签:parquet2mysql,Dinky,STRING,mysql,flink,使用,sex,parquet,name
From: https://www.cnblogs.com/braveym/p/16805795.html

相关文章

  • R.swift 的使用 swift
    导入方式:https://github.com/mac-cain13/R.swift 调用方式:letview=UIImageView(image:R.image.right_arrow()) right_arrow为导入到工程中图片的名......
  • Limit讨论,K8s 使用 CPU Limit 后,服务响应变成龟速...
    你应当小心设定k8s中负载的CPUlimit,太小的值会给你的程序带来额外的、无意义的延迟,太大的值会带来过大的爆炸半径,削弱集群的整体稳定性。 1.request和limitk8s的......
  • Centos8中如何使用Chrony同步时间
    在Linux服务器中如果我们希望所有Linux服务器都具有正确的时间,则必须配置一些NTP客户端,该客户端将始终从远程NTP服务器获取正确的时间。安装chrony使用下面​​命令​​​在......
  • grpc - 使用
    GRPC-使用protobuf定义protobuf,并将protobuf文件,通过java的plugin打包生成java-grpc相关文件。参照:grpc-protobufmvn依赖<dependency><groupId>com.goo......
  • NModbus4的使用
    NModbus4的使用 目录步骤1:打开串口步骤二:创建ModbusSerialMaster,设置超时参数步骤三:设置协议参数,开始读写可选步骤四:以asyncawait方式读写 回到顶部步......
  • Java Lambda 表达式的各种形态和使用场景,看这篇就够了
    Lambda表达式是Java8中添加的功能。引入Lambda表达式的主要目的是为了让Java支持函数式编程。Lambda表达式是一个可以在不属于任何类的情况下创建的函数,并且可以......
  • mysql使用load data infile导入数据
    做阿里天池编程题时候,需要导入sql数据,但是sql数据很大,总共有2g多。  由于没怎么做过运维,不会搞大批量数据的导入,就把里面的sql复制粘贴出来,然后粘贴到sqlyog里面慢慢......
  • 使用Kong网关API接口配置
    一、Upstream1、创建Upstream:curl-i-XPOSTIPAddress:8001/upstreams-d'name=upstream-test'-d'slots=1000'2、创建Targets目标地址并且关联Upstream:curl-i-XPO......
  • VUE3.0 中如何使用SVG图标
    1.文件下新建SvgIcon文件夹以及子文件index.js,index.vue,svg文件夹(用于存放svg图片) 2.编写index.vue组件<template><svg:class="svgClass"aria-hidden="true">......
  • DataSet与DataLoaders使用教程
    title:DataSet与DataLoaders使用教程mathjax:truedate:2022-10-0409:13:43tags:DataSetDataLoaderDataSet与DataLoaders使用教程4、PyTorch的Dataset与Data......