1、之前第九章有讲过kettle 表输出步骤,里面有简单的提到过表输出步骤里面的表分区设置,这里详细介绍下。
表分区数据:选择此选项可根据“分区”字段中指定的日期字段的值将数据拆分到多个表中。选择此选项后,数据将插入到表中,这些表的名称遵循<target table>_<date format>模式,如trade_info_20240101。在运行转换之前,必须手动创建这些表,以便在这些表中插入数据。
分区字段:指定要用于确定如何在多个表中拆分值的日期字段。此值用于生成要插入数据的日期表名称。
每个月分区数据和每天分区数据是互斥的,只能二选一,分区表需要自行创建哦,参考如下截图
2、分区表需要提前手动创建,不然会提示如下错误。
3、分区字段的类型一定需要时日期类型的,不然会提示如下错误
4、若表中的分区字段不是日期类型,也可以通过kettle相关步骤(如javascript)转换为日期类型的字段供表输出使用,也可以达到同样的效果
提前创建好分区表以及正确设置分区字段类型之后正常运行,如下所示
5、上面提到的表分区仅仅是简单的日期切片,如果想实现更复杂的分片策略,自己利用kettle步骤自定义设计灵活实现即可。
标签:表中,分区,kettle,字段,日期,分区表,分片,第三十三 From: https://www.cnblogs.com/zjBoy/p/17979251