首页 > 其他分享 >Kettle 的 安装 及 简单使用

Kettle 的 安装 及 简单使用

时间:2022-08-16 20:01:08浏览次数:78  
标签:stu2 kettle jdk Kettle 简单 安装 连接

原文:Kettle的安装及简单使用  -  阿涛必须奥利给  人生如逆旅,你我亦行人。

Kettle 的 安装 及 简单使用
一、kettle概述
1、什么是kettle

Kettle 是一款开源的 ETL 工具,纯 java 编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

2、Kettle工程存储方式

(1)以 XML 形式存储

(2)以资源库方式存储 (数据库资源库 和 文件资源库)

3、Kettle的两种设计

简述 

转换 (transformation ):完成对数据的 基础转换。

作业 (job) :控制完成整个工作流。

区别:

①作业是步骤过程,转换针对数据流。这是最大的区别。

②作业的每一个步骤,需要等前面的步骤跑完了才能执行;

转换会一次性启动所有的控件,一个控件对应一个线程,

然后让数据流从第一个控件开始,依次流向最后一个控件。

转换:数据输入 → 处理逻辑 → 输出

作业: start → 转换 (告警邮件) → 作业项 → 作业项 → end

4、Kettle的组成

①勺子(Spoon):图形化界面,开发转换 和作业。

②煎锅(Pan):命令行 调用 Tansformation。

③厨房(Kitchen):命令行 调用 Job。

④菜单(Carte):轻量级 Web 容器,建立专用 远程的ETL Server。

5、kettle特点

①基于Java,完全免费开源

②绿色版解压可用,容易配置

③ETL工具集,支持多数据源

④Trans 和 Job 两种脚本文件

⑤有图形化界面,点点点

⑥可以执行每日,每周定时任务

二、kettle安装部署和使用
Windows下安装
(1) 概述

可以在本地运行,也可以连接远程机器运行。

在实际企业开发中,是在本地环境下进行 kettle 的 job 和 Transformation 开发的。

(2) 安装步骤

1、安装 jdk 1.8.0_341 版本

在我本地 jdk 12.0.2 环境下连接时,保错:
kettle org.pentaho.ui.xul.XulException: java.lang.reflect.InvocationTargetException
后改用本地虚拟机(ubuntu) jdk 为 1.8.0_282 后可正常连接
————————————————
https://blog.csdn.net/wuzhong8809/article/details/114094712

在我本地 jdk 11 环境下连接时,保错:
org.pentaho.ui.xul.XulException: java.lang.reflect.InvocationTargetException
后改用本地 jdk 为 1.8 后可正常连接

2、下载kettle压缩包,因 kettle 为绿色软件,解压缩到任意本地路径 如 C:\DataIntegrate\kettle\pdi-ce-8.2.0.0-342\  即可

https://download.csdn.net/download/weixin_42234450/75393024?spm=1003.2122.3001.6634.4

3、右击 Spoon.bat,以管理员身份打开,启动图形化界面工具,就可以使用了


案例1:MySQL to MySQL
把 表 stu1 的数据按 id 同步到 stu2,stu2 有相同 id 则更新数据

1、在mysql中创建testkettle数据库,并创建两张表

create database testkettle;
use testkettle;
create table stu1(id int,name varchar(20),age int);
create table stu2(id int,name varchar(20));

2、往两张表中插入一些数据

insert into stu1 values(1001,'zhangsan',20),(1002,'lisi',18), (1003,'wangwu',23);
insert into stu2 values(1001,'wukong');

在data-integration\lib文件下添加mysql驱动

C:\DataIntegrate\kettle\pdi-ce-8.2.0.0-342\data-integration\lib

不同版本mysql-connector-java的jar包下载地址

 

 

3、把pdi-ce-8.2.0.0-342.zip文件拷贝到win环境中指定文件目录,解压后双击Spoon.bat,启动图形化界面工具,就可以使用了

 

主界面:

 

在kettle中新建转换--->输入--->表输入-->表输入双击

 

在数据库连接栏目点击新建,填入mysql相关配置,并测试连接

 

建立连接后,选择刚刚建好的连接,填入SQL,并预览数据:

 

以上说明stu1的数据输入ok的,现在我们需要把输入stu1的数据同步到stu2输出的数据(ctrl+shift进行连线)

 

注意:拖出来的线条必须是深灰色才关联成功,若是浅灰色表示关联失败

 

转换之前,需要做保存

 

执行成功之后,可以在mysql查看,stu2的数据
————————————————
版权声明:本文为CSDN博主「阿涛必须奥利给」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/weixin_48370579/article/details/125802177

标签:stu2,kettle,jdk,Kettle,简单,安装,连接
From: https://www.cnblogs.com/chang09/p/16592787.html

相关文章

  • 前端简单实现页面下雪效果
    html与css部分<style>*{margin:0;padding:0;box-sizing:border-box;}body{overfl......
  • Centos8.2安装docker
    1.卸载(如安装过docker可使用以下命令卸载)yumremovedocker\docker-client\docker-client-latest\docker-......
  • 如何在Ubuntu系统中安装和卸载Docker
    简介本文简单介绍如何在Ubuntu系统中安装和卸载Docker。先决条件系统要求安装Docker需要以下Ubuntu版本之一的64位版本:UbuntuJammy22.04(LTS)UbuntuImpish21......
  • Mybatis在springboot项目中的简单使用
    一、介绍MyBatis是一款优秀的持久层框架,它支持定制化SQL、存储过程以及高级映射。MyBatis避免了几乎所有的JDBC代码和手动设置参数以及获取结果集。MyBatis可以使用......
  • 腾讯云服务器安装rabbitmq及简单测试记录
    一、安装近期对消息队列的学习让我对消息中间件产生了兴趣,而作为消息队列的使用的rabbitmq,就是我学习中间件的第一步。rabbitmq和erlang的安装安装之前先检查环境:[root......
  • 简单说一下泛型
    Java泛型不变性  泛型提供了编译时类型安全检测机制,该机制允许程序员在编译时检测到非法的类型。泛型的本质是参数化类型,也就是说所操作的数据类型被指定为一个参数......
  • Java安装卸载
    Java基本知识JDKJavaDevelopmentKit开发工具包JREJavaRuntimeEnvironment运行环境JVMJavaVirtualMachine虚拟机Java开发环境搭建JDK下载与安装搜索J......
  • 虚拟机的安装
    linux虚拟机安装(以centos7为例)安装VMware虚拟机360软件管家傻瓜式安装方便快捷下载安装linux系统ios镜像软件(记住安装路径)安装linux系统打开VMvare虚拟机软件......
  • github 代码简单讲解
     github地址:https://github.com/lijiesheng/rabbitmq/tree/simplesimple模式分支1:simple-data-lose没有引入应答机制,只要消费者关闭,队列中的数据就......
  • git stash 简单用法
    做项目时,自己本地内容开发还没完成(还没有提交比本地,没有commit),又接到新的紧急bug修复可以用gitstash保存自己修改的内容修复bug提交线上再用gitstashpop还原本地......