首页 > 其他分享 >flink job 提交到yarn 需要哪些配置文件 flink submit new job

flink job 提交到yarn 需要哪些配置文件 flink submit new job

时间:2024-11-12 11:40:54浏览次数:1  
标签:配置文件 -- flink 作业 yarn job 提交

flink job 提交到yarn 需要哪些配置文件 flink submit new job



文章目录

  • 前言
  • Standalone模式
  • yarn模式


前言

本文介绍flink的任务提交模式。

Standalone模式

  • Web UI提交job
    打开flink的Web UI,在Web UI的Submit New Job提交jar包。
  • flink job 提交到yarn 需要哪些配置文件 flink submit new job_大数据


  • flink job 提交到yarn 需要哪些配置文件 flink submit new job_jar_02

  • Job参数:

Entry Class:程序的入口,指定入口类(类的全限制名)
Parallelism:任务的并行度 Program
Arguments:程序启动参数,例如–host localhost --port 7777
Savepoint Path:手动备份地址

  • 提交job要注意分配的slot总数是否足够使用,如果slot总数不够,那么job执行失败。
  • 命令行提交job
    1)提交任务:flink run -c <入口类> -p <并行度> <jar包路径> <启动参数>

flink run -c wc.WordCountSocketStream -p 1 /opt/flink-1.12.2/job/flink_tutorial-1.0-SNAPSHOT.jar --host localhost --port 7777

2)查看任务:flink list

flink job 提交到yarn 需要哪些配置文件 flink submit new job_UI_03


3)取消任务:flink cancel <Job的ID>

yarn模式

以Yarn模式部署Flink任务时,要求Flink是有 Hadoop 支持的版本,Hadoop 环境需要保证版本在 2.2 以上,并且集群中安装有 HDFS 服务。

  • Sesstion Cluster模式

Session-Cluster 模式需要先启动集群,然后再提交作业,接着会向 yarn申请一块空间后,资源永远保持不变。如果资源满了,下一个作业就无法提交,只能等到 yarn中的其中一个作业执行完成后,释放了资源,下个作业才会正常提交。所有作业共享 Dispatcher 和ResourceManager;共享资源;适合规模小执行时间短的作业

flink job 提交到yarn 需要哪些配置文件 flink submit new job_UI_04

  • 启动一个一直运行的flink集群
    ./bin/yarn-session.sh -n 2 -jm 1024 -tm 1024 [-d]
    附着到一个已存在的flink yarn session
    ./bin/yarn-session.sh -id application_1463870264508_0029
    执行任务
    flink run -c wc.WordCountSocketStream -p 1 /opt/flink-1.12.2/job/flink_tutorial-1.0-SNAPSHOT.jar --host 192.168.5.151 --port 7777
    停止任务 【web界面或者命令行执行cancel命令】
yarn-session.sh 命令分析:
用法:  
   必选  
     -n,--container <arg>            分配多少个yarn容器 (=taskmanager的数量)  
   可选  
     -D <arg>                        动态属性  
     -d,--detached                   独立运行  
     -jm,--jobManagerMemory <arg>    JobManager的内存 [in MB]  
     -nm,--name                      在YARN上为一个自定义的应用设置一个名字  
     -q,--query                      显示yarn中可用的资源 (内存, cpu核数)  
     -qu,--queue <arg>               指定YARN队列. 
     -s,--slots <arg>                每个TaskManager使用的slots数量  
     -tm,--taskManagerMemory <arg>   每个TaskManager的内存 [in MB]  
     -z,--zookeeperNamespace <arg>   针对HA模式在zookeeper上创建NameSpace 
     -id,--applicationId <yarnAppId> YARN集群上的任务id,附着到一个后台运行的yarn session中
  • 1.
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
  • 7.
  • 8.
  • 9.
  • 10.
  • 11.
  • 12.
  • 13.
  • 14.
  • 15.
  • Per Job Cluster 模式

一个 Job 会对应一个集群,每提交一个作业会根据自身的情况,都会单独向 yarn 申请资源,直到作业执行完成,一个作业的失败与否并不会影响下一个作业的正常提交和运行。独享 Dispatcher 和 ResourceManager,按需接受资源申请;适合规模大长时间运行的作业。
每次提交都会创建一个新的 flink 集群,任务之间互相独立,互不影响,方便管理。任务执行完成之后创建的集群也会消失。

flink job 提交到yarn 需要哪些配置文件 flink submit new job_jar_05

  • 启动集群,执行任务
    ./bin/flink run -m yarn-cluster -yn 2 -yjm 1024 -ytm 1024 ./examples/batch/WordCount.jar
    注意:client端必须要设置YARN_CONF_DIR或者HADOOP_CONF_DIR或者HADOOP_HOME环境变量,通过这个环境变量来读取YARN和HDFS的配置信息,否则启动会失败
    ps:如果想每次提交任务都是per-job模式,可以在flink-conf.xml文件里配置:execution.target: yarn-per-job
原文链接:https://blog.51cto.com/u_16099350/6836125

标签:配置文件,--,flink,作业,yarn,job,提交
From: https://www.cnblogs.com/sunny3158/p/18541525

相关文章

  • flink Uploaded Jars 路径 flink提交jar包
    flinkUploadedJars路径flink提交jar包漏洞描述:2019年11月11号,安全工程师HenryChen披露了一个ApacheFlink未授权上传jar包导致远程代码执行的漏洞。由于ApacheFlinkDashboard默认无需认证即可访问,通过上传恶意jar包并触发恶意代码执行,从而获取shell。影响范围<=1......
  • Flink日志输出查看方式 通过web页面 Stdout 查看控制台日志
    Flink日志输出查看方式在网上查看flink日志查看方式,竟然查询不到,因此写下这篇文章,给有此困惑的小盆友们,也给自己做个总结!前情提要:我是通过flinkwebui提交的flink任务的,因此通过flinkui查看自身控制台打印输出的。第一步:打开flink的Dashboard看到TaskManager的控制面......
  • Windows Resource Protection (WRP) 是微软引入的一项系统保护机制,旨在保护 Windows
    什么是WindowsResourceProtection(WRP)?WindowsResourceProtection(WRP)是微软引入的一项系统保护机制,旨在保护Windows操作系统中的关键资源,包括系统文件、驱动程序、注册表设置以及系统配置文件等。WRP是WindowsVista中首次引入的,它加强了对操作系统核心文件和资源的......
  • 大数据Flink - StreamGraph
    ⭐简单说两句⭐✨正在努力的小新~......
  • SpringBoot+ElasticJob实现分布式任务调度
    目录1相关简介2Zookeeper的Docker安装3Zookeeper的Windows版本安装4Zookeeper图形化客户端prettyZoo5示例代码6添加任务监听器7参考资料(感谢)1相关简介zookeeper:开源分布式应用程序协调服务下载地址:https://archive.apache.org/dist/zookeeper/2Zookeeper......
  • 三种读取配置文件的方式
      在编写JDBC的util包以读取文件时,配置文件的位置会影响其读取方式。当前,默认配置文件直接放置在src文件夹下。当读取.properties文件代码写法为:Propertiesprops=newProperties();props.load(newFileInputStream("db.properties")); 系统出现报错找不到文件,说......
  • 线性规划-JobShopSchedulingLP
    usingSystem;usingGoogle.OrTools.LinearSolver;namespaceJobShopScheduingProblem{///<summary>///线性规划(LinearProgramming)///</summary>publicclassJobShopSchedulingLP{publicstaticvoidSolve()......
  • XXL-JOB docker 初始化
    一、因为xxl-job使用的是mysq数据库,所有在yaml文件中,需要优先启动mysqlversion:'3'services:mysql:image:mysql:8.0container_name:mysql8restart:alwaysenvironment:MYSQL_ROOT_PASSWORD:123456MYSQL_DATABASE:xxl_jobpo......
  • Tomcat配置文件详解
    Tomcat配置文件详解这段XML配置文件是ApacheTomcat服务器的配置文件server.xml的一部分,它定义了Tomcat服务器如何运行,包括监听端口、连接器设置、服务组件、全局命名资源以及引擎和主机配置等。下面是对主要元素的详细解释:<Server>标签这是整个配置文件的根标签,包含了服务器......
  • 使用configparser 读 or 写 配置文件
    config.ini文件[config]username=2024222222password=123456time=202320241num1=1id1=018819num2=1id_1=018818读取配置文件defread_ini():file='config.ini'con=configparser.ConfigParser()con.read(file,encoding='u......