首页 > 其他分享 >spark-submit提交任务时执行流程(简单版)

spark-submit提交任务时执行流程(简单版)

时间:2024-07-12 18:22:03浏览次数:11  
标签:启动 流程 ApplicationMaster submit 任务 Executor NameNode spark 执行

yarn cluster模式提交spark任务

(1)执行脚本提交任务,实际是启动一个SparkSubmit的JVM进程。

(2)SparkSubmit类中的main方法反射调用YarnClusterApplication的main方法。

(3)YarnClusterApplication创建Yarn客户端,然后向yarn服务器发送执行指令:bin/java ApplicationMaster。

(4)Yarn(Resource Manager)收到指令后会在指定的NameNode中启动Spark的ApplicationMaster。

(5)ApplicationMaster启动Driver线程,执行用户的作业。

(6)ApplicationMaster向ResourceManager注册,申请资源。

(7)ResourceManager启动NameNode,NameNode向ApplicationMaster注册。

(8)ApplicationMaster向NameNode发送指令,bin/java YarnCoarseGrainedExecutorBackend。启动Executor后端进程。

(9)CoarseGrainedExecutorExecutorBackend进程会和driver通信,启动计算对象Executor等待接收任务,注册已经启动的Executor。

(10)driver线程继续执行完成作业的调度和分配,自身任务的执行和监控任务的执行。

注:SparkSubmit是运行在提交命令的服务器,和ApplicationMaster和CoarseGrainedExecutorBackend是独立的进程。

Driver是运行在ApplicationMaster上的线程。Executor和YarnClusterApplication是对象。

参考:尚硅谷《Spark内核文档》。

标签:启动,流程,ApplicationMaster,submit,任务,Executor,NameNode,spark,执行
From: https://www.cnblogs.com/jmd300/p/18299161

相关文章

  • 开通免费企业域名邮箱流程
    利用163开通免费的企业域名邮箱域名购买在此以腾讯云为例登录后先去完善实名认证信息个人建议二级域名和公司名称相关,简短好记个人建议一级域名选择com、cn、cc、net、top等一级域名找到喜欢的域名后,注意下拉查看续费价格,是否可以接受确认好价格和购买时间,然后选......
  • 机器学习代谢组学分析全流程 高分文章“利器”!
    代谢组学是对某一生物或细胞在一特定生理时期内所有代谢产物同时进行定性定量分析的学科,被广泛用于揭示小分子与生理病理效应间的关系。目前,代谢组学已经被应用于药物开发的各个阶段(如药物靶标识别、先导化合物发现、药物代谢分析、药物响应和耐药研究等)。基于代谢组学的高性价......
  • 前端web程序发布到windows服务器流程详解
    假定已完成前端程序开发并完成构建。#步骤1:准备服务器环境我们将使用IIS作为Web服务器。确保你的Windows系统已经安装了IIS。#步骤2:配置Web服务器1.打开"控制面板">“程序”>“启用或关闭Windows功能”。2.选中"InternetInformationServices",确保"Web服务器(IIS......
  • 服务器部署全流程-阿里云服务购买到宝塔部署
    一、部署前端页面1.阿里云购买试用免费服务器 找到一个自己想要的服务器,然后再这里选择服务器的系统,我们一般选择CentOS(也就是Linux系统),其他的都可以选择系统默认2.购买后跳转至阿里云控制台,点击三个点,搜索服务器密码,重新修改密码3.启动该实例后进行远程连接......
  • pdf.js源码分析-字体加载流程
    pdf.js中的字体加载流程,下面演示一种Type1的字体的加载流程,会把一些兼容性的内容省去,只记录字体数据的加载过程中涉及到的方法和作用:evaluator.js->handleSetFont:操作符列表中加载字体evaluator.js->loadFont:加载字体的方法evaluator.js->preEvaluateFont:对字体信息进行......
  • 新技术新产品(服务)认定流程及注意事项
    北京市新技术新产品(服务)认定,作为推动技术创新与产业升级的重要环节,一直是众多高新技术企业关注的焦点。这一认定不仅能够提升企业的市场竞争力,还能享受政府的多项优惠政策支持。整个认定流程涵盖从申报准备、材料提交、专家评审到最终公布等多个阶段,要求企业详尽展示其技术的......
  • 在Linux中,当用户在浏览器当中输入⼀个网站,计算机对dns解释经过那些流程?
    当用户在Linux系统下的浏览器中输入一个网站URL时,DNS(DomainNameSystem,域名系统)解析的过程大致遵循以下步骤:本地缓存检查:浏览器首先检查其自身的DNS缓存中是否存在该域名的记录。如果缓存中有有效的记录,浏览器可以直接使用这个IP地址访问网站,而无需进一步的DNS查询。......
  • 01_spark入门
    SparkSpark作为分布式计算框架,基于MapReduce框架开发,但是也有以下区别:Spark基于Scala语言开发,MR基于Java语言开发;Scala是函数式编程语言,对于函数间相互调用效率更高;而Java是面向对象语言,函数间调用必须依赖于对象,效率低。MapReduce核心是一次性计算,不适合迭代计......
  • 渗透测试全流程
    1信息收集渗透测试中的信息收集是关键的初始阶段,其作用在于系统性地获取目标系统、网络或应用的详细信息,包括域名及子域名信息、目标网站系统、CMS指纹、目标网站IP、开放的端口等1.1在Kali机中使用命令进行信息收集  命令的具体使用请参考另外一篇文章  网址:K......
  • 遥控器Tab键切换时按键音流程
    用遥控器进行界面的tab切换时,会有音量出现,梳理下tab切换时按键音的逻辑。基于AndroidU的代码。从ViewRootImpl的processKeyEvent方法开始,这个方法用于处理按键事件。首先看下该方法的调用堆栈。atandroid.view.ViewRootImpl$ViewPostImeInputStage.processKeyEvent(ViewRo......