首页 > 其他分享 >ETL工具---Kettle介绍、安装

ETL工具---Kettle介绍、安装

时间:2022-11-29 10:37:29浏览次数:54  
标签:转换 数据 Kettle --- 任务 安装 ETL

数据归集是把在多数据源的数据汇聚、整理、清洗、转换后,加载到一个新的数据源,为数据使用者提供统一数据视图的数据集成方式。

数据归集

数据归集是共享或者合并来自于两个或者更多应用的数据源,创建一个具有更多功能的企业应用的过程。传统的商业应用有很强的面向对象性——即他们依靠持续的数据结构为商业实体和过程建模。当这种情况发生时,逻辑方式是通过数据共享或合并进行整合,而其他情况下,来自于一个应用的数据可能是重新构造才能和另一个应用的数据结构匹配,然后被直接写进另一个数据库。

下面我们将介绍一个目前比较成熟稳定的数据采集工具:Kettle

Kettle 介绍

Kettle是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定。

Kettle 中文名称叫水壶,该项目的主程序员MATT 希望把各种数据放到一个壶里,然后以一种指定的格式流出。

Kettle这个ETL工具集,它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么,而不是你想怎么做。

Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。

Kettle目前包含五个产品:Spoon、Pan、Chef、Kithcen、Encr。

SPOON:是一个图形用户界面,允许你通过图形界面来设计ETL转换过程(Transformation)和任务。

PAN:转换(trasform)执行器;允许你批量运行由Spoon设计的ETL转换 (如使用一个时间调度器)。Pan是一个后台执行的程序,没有图形界面。

CHEF:允许你创建任务(Job)。 任务通过允许每个转换,任务,脚本等等,更有利于自动化更新数据仓库的复杂工作。任务通过允许每个转换,任务,脚本等等。任务将会被检查,看看是否正确地运行了。

KITHCEN:作业(job)执行器;允许你批量使用由Chef设计的任务 (如使用一个时间调度器)。KITCHEN也是一个后台运行的程序。

ENCR:用来加密连接数据库密码与集群时使用的密码。

Kettle 下载和部署

1、我们可以进入​ Kettle官网 ​进行下载,进入之后,下拉页面,看到如图所示;

ETL工具---Kettle介绍、安装_环境配置

查看所有版本,我们可以看到最新版本以及所有旧版本的Kettle

ETL工具---Kettle介绍、安装_数据_02

此处选择7.1版本

ETL工具---Kettle介绍、安装_数据_03

2、Kettle 环境配置

由于Kettle是使用Java语言编写的,所有Kettel的运行需要有Java环境,安装JDK,Windows安装jdk一步步默认安装jdk后配置好环境变量就好。

3、运行Kettle

进入到Kettle目录,如果Kettle部署在windows环境双击Spoon.bat文件启动Kettle,如果是在Linux环境下,则运行spoon.sh文件启动。出现如下界面,则我们的Kettle就安装成功了。

ETL工具---Kettle介绍、安装_数据_04

ETL工具---Kettle介绍、安装_商业_05

至此,Kettle的下载、环境配置和安装就基本完成了。

标签:转换,数据,Kettle,---,任务,安装,ETL
From: https://blog.51cto.com/u_15867943/5894201

相关文章

  • 【小航的算法日记】线性枚举(二) - 统计法入门
    目录​​一、概念​​​​二、模板​​​​三、例题​​​​题:1550.存在连续三个奇数的数组​​​​解:​​​​题:1295.统计位数为偶数的数字​​​​解:​​​​题:540.有......
  • 【小航的算法日记】进制转换(二) - 进阶
    目录​​一、概念​​​​二、模板​​​​三、例题​​​​题:202.快乐数​​​​解:​​​​题:168.Excel表列名称​​​​解:​​​​题:171.Excel表列序号​​​​解:​​......
  • 【小航的算法日记】进制转换(一) - 入门
    目录​​一、概念​​​​二、模板​​​​三、例题​​​​题:剑指Offer15.二进制中1的个数​​​​解:​​​​题:258.各位相加​​​​解:​​​​题:1290.二进制链表转......
  • 【小航的算法日记】字符串算法(二) - 字符串比较
    目录​​一、概念​​​​二、模板​​​​三、例题​​​​题:剑指Offer05.替换空格​​​​解:​​​​题:面试题10.05.稀疏数组搜索​​​​解:​​​​题:1763.最长的......
  • Django-2.5关联-笔记
    模型类关系关系字段类型关系型数据库的关系包括三种类型:ForeignKey:一对多,将字段定义在多的一端中。ManyToManyField:多对多,将字段定义在任意一端中。OneToOneField:一对一,将字......
  • 螺旋矩阵II-LeetCode59 考验代码能力
    力扣链接:https://leetcode.cn/problems/spiral-matrix-ii/题目  给你一个正整数 n ,生成一个包含 1 到 n2 所有元素,且元素按顺时针顺序螺旋排列的 nxn 正方......
  • 大数据系统-架构图
    架构图1  架构图2  架构图3  架构图4  架构图5  架构图6  架构图7  架构图8  架构图9  架构图10  架构图11......
  • 大学学习历程--wy
    大一上:初识计算机专业,学习计算机导论,linux的基本使用,接触第一门编程语言python,英语过四级。(学校开课:高数,线代,计导,Linux等)大一寒假:自学c语言,持续学习英语。大一下:学习c语......
  • 002 安装docker-放弃
    1、查看是否已安装docker#yumlistinstalled|grepdocker2、安装docker#yum-yinstalldocker  是不是已经安装成功了?3、启动docker  啊哦,怎么安......
  • AWS上DevOps实验(二)--- 使用Terraform创建VPC网络
    从本文档起,作者计划在AWS上做一系列DevOps/IaC相关实验,本文是第二篇,使用Terraform创建VPC网络。本次实验架构图Terraform代码执行主文件main.tf#terraformcodetod......