首页 > 其他分享 >Kettle使用教程

Kettle使用教程

时间:2023-05-10 22:56:59浏览次数:39  
标签:教程 转换 Kettle Excel 使用 数据 ETL

Kettle使用教程

Kettle是什么

kettle原本是水壶的意思,是可以将一种类型的数据转换为另一种类型的数据,还可以对同种类型的数据进行筛选,分表操作。

对于企业或行业应用来说,经常会遇到各种数据的处理,转换,迁移,掌握一种ETL工具的使用,必不可少,这篇文章介绍的ETL工具是Kettle,现在已经更名为PDI。

可能我对于Kettle的了解还不是很深刻,但是先做好总结,为后续的ETL ==> 数据抽取(extract)、转换(transform)、加载(load)打好基础。

Kettle有什么用?

ketlle可以在多种数据源之间进行快速转换。

kettle开发步骤:

点点点,拖拖拖,完事!(保命

  • 新建转换

  • 构建Kettle的数据流图

  • 配置数据流图中的各个组件

  • 保存并启动执行

Kettle的数据转换

Txt数据转换Excel

 

 

 

 

 

 

 

 

Excel输出

 

 

 

 

Excel数据转换mysql数据

 

 

 

 

 

 

 

 

 

这里不一定要用JNDI,还可以使用JDBC来链接数据库,只要在后面将jar包放到lib目录里面就行了,注意版本号一定要个MySQL数据库的版本号一致。

 

 

 

 

 

 

 

 

 

MySQL数据表间转换

 

 

 

 

 

 

 

插入-更新组件

 

 

 

 

 

switch-case组件

 

 

 

 

 

 

执行SQL脚本

 

 

设置转换参数

需求

 

 

 

 

 

作业(Job)开发

 

 

 

标签:教程,转换,Kettle,Excel,使用,数据,ETL
From: https://www.cnblogs.com/liam-sliversucks/p/17389584.html

相关文章

  • 【2023最新】小白Anaconda+Python+Jupyter环境安装教程+kernel安装
    目录下载Anaconda安装包安装配置Anaconda环境测试是否安装成功为anaconda添加国内源创建环境JupyterNotebook启动Jupyter更改默认工作目录在jupyter中使用conda中安装的虚拟环境参考博客下载Anaconda安装包历史版本(最新版本可能安装不了旧版Python)https://repo.anaconda.com/......
  • Oracle之table()函数的使用,提高查询效率
    目录一、序言二、table()函数使用步骤三、table()具体使用实例3.1table()结合数组使用3.2table()结合PIPELINED函数(这次报表使用的方式)3.3table()结合系统包使用一、序言前段时间一直在弄报表,快被这些报表整吐了,然后接触到了Oracle的table()函数。所以今天把table()函数的......
  • RabbitMQ使用详解
      RabbitMQ是基于AMQP的一款消息管理系统。AMQP(AdvancedMessageQueuingProtocol),是一个提供消息服务的应用层标准高级消息队列协议,其中RabbitMQ就是基于这种协议的一种实现。常见mq:ActiveMQ:基于JMSRabbitMQ:基于AMQP协议,erlang语言开发,稳定性好RocketMQ:基于JMS,阿里......
  • 使用 JProfiler 监控 JBoss 运行情况
    JProfiler是一个著名的用于java系统监控分析的软件,功能很强大,可以监控普通的javaapplication,applet,javawebstart,applicationserver等等。除了可以监控本地的程序,还可以对远程服务器上跑的应用进行监控。本文以JBoss为例,对JProfiler的安装......
  • day3 Hadoop安装与使用-Hadoop安装篇【上】
    【os】因为最近没有带大数据实验那本书,这几篇使用的都是大数据原教材-大数据技术原理运用(第三版)。其实两本内容差不多,但是实验那本教材安装过程更详细一点。 【正文】2.Hadoop安装【Hadoop单机安装】Hadoop使用版本:3.1.3下载地址:https://archive.apache.org/dist/hadoop/co......
  • json使用系列分享一
                                                            Json使用介绍JSON(JavaScriptObjectNotation)是一种轻量级的数据交换格式。易于人阅读和编写。同时也易于机器解析和生成。JSON采用完全独立于语言的文本格......
  • Nuxt3.0中使用EChart可视化图表
    ......
  • svn简明教程
    SVN简明课程1.版本控制介绍1.1.什么是版本控制版本控制系统用于保存编写开发应用程序时的文档的各个修订版(revision)。版本控制也称作RevisionControlSystem(RCS)。名词解释:修订版(revision):可以认为是某个文件在其生命周期内各个保存的快照,每个快照和一个时间区间对应。版本......
  • 使用 Python 语言实现的简单版俄罗斯方块的代码示例
    importpygameimportrandompygame.init()#定义颜色BLACK=(0,0,0)WHITE=(255,255,255)GRAY=(128,128,128)CYAN=(0,255,255)BLUE=(0,0,255)ORANGE=(255,165,0)YELLOW=(255,255,0)GREEN=(0,128,0)PURPLE=(128,0,128)#定义方块......
  • 使用docker搭建nodebb论坛
    1、首先放开4567端口因为这是nodebb的端口号firewall-cmd--zone=public--add-port=4567/tcp--permanent2、构建所需要的docker网络dockernetworkcreatemongo-net3、安装mongodockerrun--namemongo--restartalways--networkmongo-net-dmongo--wiredTigerCacheSizeGB......