首页 > 其他分享 >Docker镜像、Spark支持多表...Apache SeaTunnel 2.3.8版本将带来的惊喜

Docker镜像、Spark支持多表...Apache SeaTunnel 2.3.8版本将带来的惊喜

时间:2024-09-27 11:04:42浏览次数:6  
标签:... SeaTunnel 多表 支持 Job 版本 2.3 日志

file

Apache SeaTunnel 2.3.8版本即将于大家见面,近日,Apache SeaTunnel PMC Member 范佳在社区的交流会上为大家提前透露了关于这个新版本即将进行的功能与特性更新概况,详细内容如下:

SeaTunnel 简介

SeaTunnel是一个高性能的开源分布式数据集成系统,支持各种数据源的实时流式和离线批处理,适用于海量数据的集成。它具有以下特点:

  • 海量连接器:支持100+种数据源和存储系统。
  • 多引擎支持:兼容多种数据处理引擎,包括SeaTunnel Zeta Engine、Spark和Flink。
  • HTTP支持:可以通过HTTP接口进行数据集成。
  • 流批一体:同时支持流处理和批处理。
  • 流速控制:能够控制数据流的速率。
  • 自动建表功能:自动根据数据结构创建表。

2.3.8 版本新功能与特性

在即将发布的2.3.8版本中,社区将对SeaTunnel进行以下功能和特性的更新:

Docker 镜像

新版本将提供官方版本的 Docker 镜像,将包含几乎所有的 Connector,用户无需下载安装包,通过直接通过拉取镜像,可以更快地运行 SeaTunnel,减轻 SeaTunnel 部署的复杂度。

file

  • 通过命令构建镜像:对于本地部署,并且有定制化需求的用户,可以通过命令行构建镜像;

file

  • 通过命令启动服务:支持通过命令启动服务进行分布式部署,以及提交任务和查询任务状态等;当然。也可以通过 rest-API 提交任务。

file

  • 通过命令提交服务

file

Spark 支持多表

目前,SeaTunnel 仅支持 Zeta Engine 对多表的支持,新版本将增加 Spark 引擎对多表的支持,可以自动识别并自动运行多表任务。

file

另外,Flink 对于多表的支持已经在推进之中,感兴趣的朋友欢迎来 GitHub 参与共建。

Config 参数支持默认值

目前,SeaTunnel 允许在 config 参数进行变量配置,但每个变量需要手动配置。新版本则将允许在配置参数中使用默认值,提高了配置的灵活性。

file
file

适配 Prometheus 进行集群监控

此前,SeaTunnel 提供了接口来获取任务运行的指标,新版本将支持适配 Prometheus 进行集群监控。Prometheus 将定期拉取 SeaTunnel 的集群任务状态,并以可视化界面展示出来,以更便利地监控集群的状态,及时发现问题。

file

file
Dashboard展示

添加 Embedding transform

通过 Embedding transform,支持将机器学习模型嵌入到数据转换过程中,把原始字段转换成向量值,再存储到相应的机器学习数据库。目前,SeaTunnel 支持的机器学习模型提供商包括豆包、千帆、OpenAI。

file
file

Job 级别日志过滤查看

增加了Job级别的日志过滤和查看功能,可以通过三种方式实现日志过滤。

第一种是通过把 Job ID 打印到日志的最前面,用户可以通过搜索 Job ID 来找到属于此 Job 的所有日志,这样可以把日志过滤出来,解决当多任务并发时,一旦其中一项任务出错,通过日志来排查问题相对比较困难的难题。

file

第二种是根据 Job ID 拆分文件,通过修改 log 配置文件,很多文件都是配置好的,只需要简单修改,任务就会在每一个 Job 打一个日志文件。相同的 Job ID 会被归类到同一个文件下,这样就方便大家查找日志文件。

file

修改log4j2.properties配置文件示例:

...
rootLogger.appenderRef.file.ref = routingAppender
...

appender.file.layout.pattern = %d{yyyy-MM-dd HH:mm:ss,SSS} %-5p [%-30.30c{1.}] [%t] - %m%n
...

Kafka 支持读取/写入 Protobuf 类型数据

增强了 Kafka 连接器对 Protobuf 数据格式的支持,在 Kafka 连接器下增加对 Protobuf 数据类型的定义,进行数据读取和写入。

file

文件支持读取压缩包

增加了对压缩文件格式的读取支持,省去了解压缩的步骤。

file

其他功能

此外,新版本还将移除对系统表的过滤,允许用户读取系统表;增强对Paimon流式读取和动态桶写入的支持。

如何获取最新版本和参与贡献

下载

SeaTunnel 2.3.8 版本预计将于 10 月初发布,届时可关注 SeaTunnel 官网下载页面 获取最新版本的SeaTunnel。

参与贡献

结语

SeaTunnel 2.3.8 版本的发布将带来一系列新功能和改进,使得数据集成更加高效和灵活。感谢所有贡献者的努力,让 SeaTunnel 成为一个更加强大的数据集成工具。

更多信息请访问 SeaTunnel 官网

本文由 白鲸开源 提供发布支持!

标签:...,SeaTunnel,多表,支持,Job,版本,2.3,日志
From: https://www.cnblogs.com/seatunnel/p/18435258

相关文章

  • 三,MyBatis-Plus 的各种查询的“超详细说明”,比如(等值查询,范围查询,模糊查询...)
    三,MyBatis-Plus的各种查询的“超详细说明”,比如(等值查询,范围查询,模糊查询...)@目录三,MyBatis-Plus的各种查询的“超详细说明”,比如(等值查询,范围查询,模糊查询...)1.条件构造器介绍2.准备工作:3.等值查询3.1eq(条件筛选属性=?)3.2allEq(满足多个条件字段的值的筛选)3.3......
  • 嘉林文化传媒(绍兴)有限公司是一家出品公司曾出品过《盛夏里的旧时光》...嘉林娱乐引领
    嘉林文化传媒(绍兴)有限公司出品的影视剧《盛夏里的旧时光》是一部备受期待的作品。这部剧以其深刻的情感和引人入胜的剧情,讲述了年幼时不幸失去双亲的林屿嘉展开,他在冰冷的亲戚家中度过了十个春秋。十六岁那年,林屿嘉的生活因转学到许肆家附近而发生转折,两个少年由此建立起深厚的友谊......
  • C++ 原始字符串(raw string literal )R“(...)“
    C++11可以在代码里嵌入一段原始字符串,该原始字符串不作任何转义,所见即所得。这个特性对于编写代码时要输入多行字符串,或者含带有特殊字符的字符串提供了巨大方便。语法:     R"(...)"记忆点:1.不做任何转义 stringstr="aaa\nbbb\nccc\n"; cout<<str<<endl......
  • Mysql梳理9——多表查询连接分类及实现内、外连接
    9 多表查询的分类9.1 等值连接 VS 非等值连接SELECT*FROMjob_grades;SELECTlast_name,salary,grade_levelfromemployeese,job_gradesj--WHEREe.salaryBETWEENj.lowest_salandhighest_sal;WHEREe.salary>=j.lowest_salANDe.salary<=j.highest_s......
  • 外包干了10个月,技术退步明显.......
    先说一下自己的情况,大专生,18年通过校招进入武汉某软件公司,干了接近4年的功能测试,今年年初,感觉自己不能够在这样下去了,长时间呆在一个舒适的环境会让一个人堕落!而我已经在一个企业干了四年的功能测试,已经让我变得不思进取,谈了2年的女朋友也因为我的心态和工资和我分手了。于......
  • 【VUE】[Violation] Added non-passive event listener to a scroll-blocking...
    1.问题[Violation]Addednon-passiveeventlistenertoascroll-blocking<某些>事件.Considermarkingeventhandleras'passive'tomakethepagemoreresponsive.See<URL>译:[违规]向滚动阻止添加了非被动事件侦听器<某些>事件.请考虑将事件处理程序标记为“被......
  • 未完待续.....
    Music:Timeless终于知道为什么上海的雨总是不停地下......属于我的艳阳天还没有到来。自从中秋回来,家里人把我当成ICU里的重症病患,天天目光注视我吃药,带我去医院......我真的找不到人可以倾诉了.....吃了两天,我以前在吃药期间的症状又浮现出来...记忆力变得很差先不说,......
  • 【YashanDB知识库】多表更新报错 YAS-04344 multi-table update is not supported
    本文内容来自YashanDB官网,具体内容请见https://www.yashandb.com/newsinfo/7369204.html?templateId=1718516【问题分类】功能使用【关键字】YAS-04344,UPDATE,multi-tableupdate,MERGEINTO【问题描述】在崖山环境执行类似以下语法进行多表更新报YAS-04344multi-tableupdate......
  • 【YashanDB知识库】多表更新报错 YAS-04344 multi-table update is not supported
    本文内容来自YashanDB官网,具体内容请见https://www.yashandb.com/newsinfo/7369204.html?templateId=1718516【问题分类】功能使用【关键字】YAS-04344,UPDATE,multi-tableupdate,MERGEINTO【问题描述】在崖山环境执行类似以下语法进行多表更新报YAS-04344multi-tableupdateisn......
  • 服了呀,被现在的00后卷麻了....
    现在的小年轻真的卷得过分了。前段时间我们公司来了个00年的,工作没两年,跳槽到我们公司起薪18K,都快接近我了。后来才知道人家是个卷王,从早干到晚就差搬张床到工位睡觉了。最近和他聊了一次天,原来这位小老弟家里条件不太好,一大家子指望他一个人养活,所以他再大三的时候就已经开......