一、Kettle简介
1.1、ETL是什么
ETL(Extract-Transform-Load的缩写,即数据抽取、转换、装载的过程),对于企业或行业应用来说,经常会遇到各种数据的处理,转换,迁移,所以了解并掌握一种etl工具的使用,必不可少,而Kettle就是ETL工具的一种。
1.2、Kettle是什么
Kettle 中文名称叫水壶,是一款国外开源的ETL工具,纯java编写,可以在Window、Linux、Unix上运行,绿色无需安装,数据抽取高效稳定【它允许你管理来自不同数据库的数据,通过提供一个图形化的用户环境来描述你想做什么】
Kettle中有两种脚本文件,transformation和job,transformation完成针对数据的基础转换,job则完成整个工作流的控制。
Kettle(现在已经更名为PDI,Pentaho Data Integration-Pentaho数据集成)
1.3、Kettle的结构
Kettle的结构【Spoon】和【Data Integration Server】;
【Spoon】是构建ETL Jobs和Transformations的工具;Spoon以拖拽的方式图形化设计,能够通过spoon调用专用的数据集成引擎或者集群。