首页 > 其他分享 >海豚调度任务类型Apache SeaTunnel部署指南

海豚调度任务类型Apache SeaTunnel部署指南

时间:2024-04-02 16:34:58浏览次数:26  
标签:SeaTunnel seatunnel start 任务 sh Apache spark 海豚

file

Apache DolphinScheduler已支持Apache SeaTunnel任务类型,本文介绍了SeaTunnel任务类型如何创建,任务参数,以及任务样例。

一、Apache SeaTunnel

SeaTunnel 任务类型,用于创建并执行 SeaTunnel 类型任务。worker 执行该任务的时候,会通过 start-seatunnel-spark.sh 、 start-seatunnel-flink.sh 和 seatunnel.sh 命令解析 config 文件。

二、创建任务

  • 点击项目管理 -> 项目名称 -> 工作流定义,点击“创建工作流”按钮,进入 DAG 编辑页面;
  • 拖动工具栏的 任务节点到画板中。

三、任务参数

  • 启动脚本:选择你想要运行任务的启动脚本,包括 seatunnel.sh, start-seatunnel-flink-13-connector-v2.sh, start-seatunnel-flink-15-connector-v2.sh, start-seatunnel-flink-connector-v2.sh, start-seatunnel-flink.sh, start-seatunnel-spark-2-connector-v2.sh, start-seatunnel-spark-3-connector-v2.sh, start-seatunnel-spark-connector-v2.sh, start-seatunnel-spark.sh
  • FLINK
  • 运行模型:支持 run 和 run-application 两种模式
  • 选项参数:用于添加 Flink 引擎本身参数,例如 -m yarn-cluster -ynm seatunnel
  • SPARK
  • 部署方式:指定部署模式,cluster client
  • Master:指定 Master 模型,yarn local spark mesos,其中 spark 和 mesos 需要指定 Master 服务地址,例如:127.0.0.1:7077
  • SEATUNNEL_ENGINE
  • 部署方式:指定部署模式,cluster local
  • 自定义配置:支持自定义配置或从资源中心选择配置文件
  • 脚本:在任务节点那自定义配置信息,包括四部分:env source transform sink

四、任务样例

该样例演示为使用 Flink 引擎从 Fake 源读取数据打印到控制台。

1.在 DolphinScheduler 中配置 SeaTunnel 环境
若生产环境中要是使用到 SeaTunnel 任务类型,则需要先配置好所需的环境,配置文件如下:/dolphinscheduler/conf/env/dolphinscheduler_env.sh。

file
2.配置 SeaTunnel 任务节点
根据上述参数说明,配置所需的内容即可。

file

Config 样例

env {
  execution.parallelism = 1
}

source {
  FakeSource {
    result_table_name = "fake"
    field_name = "name,age"
  }
}

transform {
  sql {
    sql = "select name,age from fake"
  }
}

sink {
  ConsoleSink {}
}

————————————————

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。

原文链接:https://blog.csdn.net/zhengzaifeidelushang/article/details/136685864

本文由 白鲸开源 提供发布支持!

标签:SeaTunnel,seatunnel,start,任务,sh,Apache,spark,海豚
From: https://www.cnblogs.com/DolphinScheduler/p/18110883

相关文章

  • 使用Apache POI和Jsoup将Word文档转换为HTML
    简介在现代办公环境中,Word文档和HTML页面都是常见的信息表达方式。有时,我们需要将Word文档转换为HTML格式,以便在网页上展示或进行进一步的处理。本文将介绍如何使用ApachePOI库和Jsoup库来实现Word文档到HTML的转换,并处理文档中的图片资源。环境准备Java开发环境Apac......
  • SeaTunnel DB2 Source Connector 使用文档(含详细操作步骤)
    DB2是IBM的一款关系型数据库管理系统,JDBCDB2SourceConnector是一个用于通过JDBC读取外部数据源数据的连接器。ApacheSeaTunnel如何支持JDBCDB2SourceConnector?请参考本文档。支持引擎SparkFlinkSeaTunnelZeta引擎主要特性批处理(batch)精确一次(exactly-once)列投......
  • 解析Apache Kafka:在大数据体系中的基本概念和核心组件
    关联阅读博客文章:探讨在大数据体系中API的通信机制与工作原理关联阅读博客文章:深入解析大数据体系中的ETL工作原理及常见组件关联阅读博客文章:深度剖析:计算机集群在大数据体系中的关键角色和技术要点关联阅读博客文章:深入理解HDFS工作原理:大数据存储和容错性机制解析引......
  • Apache Flink 简介
    ApacheFlink简介前言计算引擎大数据计算引擎分为离线计算和实时计算,离线计算就是我们通常说的批计算,代表是HadoopMapReduce、Hive等大数据技术。实时计算也被称作流计算,代表是Storm、SparkStreaming、Flink等大数据技术。计算引擎也在不断更新迭代,下图展示的是每一代计算......
  • 各位学弟学妹们,参与Apache顶级开源项目并没有想象中的难
    在笔者出版《RocketMQ技术内幕》后,并随着分享了60篇+的RocketMQ相关文章,在B站与官方联动组织了RocketMQ源码分析视频后,我被官方授予RocketMQ优秀布道师,也是明证言顺的参与了一个Apaceh顶级开源项目。在这里,和大家一起来分享一下关于如何参与一个开源项目。参与开源项目的......
  • Apache OFBiz 身份验证绕过漏洞 (CVE-2023-51467)
    ApacheOFBizAuthenticationBypassVulnerability(CVE-2023-51467)ApacheOFBizAuthenticationBypassVulnerability(CVE-2023-51467)PublishedbyDikshaOjhaonDecember27,2023SonicWall威胁研究团队在基于Java的Web框架ApacheOFBiz中发现了身份验证绕......
  • Linux - 搭建一套Apache大数据集群
     一、服务器操作系统主机名操作系统node01Centos7.9node02Centos7.9node03Centot7.9 二、大数据服务版本服务版本下载Zookeeper3.5.7DownloadHadoop3.3.6DownloadHive3.xDownloadHbase2.xDownloadSpark3.xDownload......
  • Apache POI源码
    官网:ApachePOI-theJavaAPIforMicrosoftDocumentsReleaseNotes:ChangeLogs:javadocs:ApachePOI5.0.xJavadocsApachePOI4.1.xJavadocsApachePOI4.0.xJavadocsApachePOI3.17JavadocsHSSF-提供读写MicrosoftExcel格式档案的功能。XSSF-提供读写Micr......
  • Unresolved plugin: 'org.apache.maven.plugins:maven-compiler-plugin:3.7.0'
    1.找到maven安装目录,查看本地仓库,按路径查看jar包状态2.不正常删掉此jar包文件夹3.reloadmaven依赖,让它自己再从中央仓库下一遍 出现此报错的原因:1.你写的插件版本不存在访问Maven中央仓库(https://search.maven.org/)并搜索 maven-jar-plugin,查看可用的版本。确保你使用......
  • 【干货】Apache DolphinScheduler2.0升级3.0版本方案
    升级背景因项目需要使用数据质量模块功能,可以为数仓提供良好的数据质量监控功能。故要对已有2.0版本升级到3.0版本以上,此次选择测试了3.0.1和3.1.1两个版本,对进行同数据等任务调度暂停等操作测试,最后选择3.0.1版本原因:1.3.1.1在测试sql任务时,同时启动上百sql任务时,会出......