首页 > 其他分享 >今日总结

今日总结

时间:2024-02-26 22:13:55浏览次数:24  
标签:总结 Task 分区 Worker RDD Job Executor 今日

Master和Worker

在Spark中,Master是独立集群的控制者,而Worker是工作者。一个Spark独立集群需要启动一个Master和多个Worker。Worker就是物理节点,可以在上面启动Executor进程。

Executor

在每个Worker上为某应用启动的一个进程,该进程负责运行Task,并且负责将数据存在内存或者磁盘上,每个任务都有各自独立的Executor。Executor是一个执行Task的容器。实际上它是一组计算资源(cpu核心、memory)的集合。

一个Worker节点可以有多个Executor。一个Executor可以运行多个Task。

executor创建成功后,在日志文件会显示如下信息: INFO Executor: Starting executor ID [executorId] on host [executorHostname]

Job

一个Job包含多个RDD及作用于相应RDD上的各种操作,每个Action的触发就会生成一个job。用户提交的Job会提交给DAGScheduler,Job会被分解成Stage,Stage会被细化成Task。

Task

被发送到executor上的工作单元。每个Task负责计算一个分区的数据。

Stage

在 Spark 中,一个作业(job)会被划分为多个阶段(stage)。同一个 Stage 可以有多个 Task 并行执行(task 数=分区数)。

阶段之间的划分是根据数据的依赖关系来确定的。当一个 RDD 的分区依赖于另一个 RDD 的分区时,这两个 RDD 就属于同一个阶段。当一个 RDD 的分区依赖于多个 RDD 的分区时,这些 RDD 就属于不同的阶段。

标签:总结,Task,分区,Worker,RDD,Job,Executor,今日
From: https://www.cnblogs.com/zhaoyueheng/p/18035699

相关文章

  • 近期总结 2024.2.26
    dp专场*2。CF1608FMEXCounting题意:给出\(n,m,b_{1...n}\),求出有多少个长度为\(n\)的序列\(a\)满足\(\foralli\in[1,n],\space0\lea_i\len\)且\(|\operatorname{mex}\{a_1,a_2,...,a_i\}-b_i|\lem\)。\(1\len\le2000,\space1\lek\le50\)很简单的......
  • 比赛总结录
    比赛总结录【寒假集训】20240206测试90/400T1.珠子题目链接0/100思路:双指针,赛场上想到了,但是没有打出来代码。T2.数组题目链接0/100思路:暴力+记录。赛场上也想到了,但是赛场上忽略了一个点。又因为多打了几行而丢了$40pts$。T3.幸运区间题目链接60/100思......
  • 补上之前空缺的总结,另外反思一下自己
    前几天学习了javase的方法,其实挺简单的,就类似于学习c++的时候用的函数,是解决一类问题的步骤。不过要注意的是方法包括在类或对象中,这一点与c++是肯定不同的,因为java更加面向对象,在编写方法时要注意,一个方法最好用于解决一个问题,实现一个功能,方法的格式是修饰+类型+方法名+实现部分......
  • Spring Boot 信息泄露总结
    1.目标2.微信sessionkey泄露导致任意用户登录点击快捷登录,发现可以使用手机号进行登录发现sessionkey,使用工具利用没有账号,尝试13111111111(一般测试账号是这个),成功登录 3.进行指纹识别,发现为SpringBoot框架,测试发现SpringActuator信息泄露 4.发现actuator/gate......
  • SSH框架使用AOP代理+自定义注解遇到的相关问题总结
    1、AOP注解失效问题编写完成注解和AOP切面类时,在controller中加上注解,注解不生效。在配置文件xml中开启AOP注解:<aop:aspectj-autoproxyproxy-target-class="true"/>如果该配置以加在项目里,但是还是不生效。需要检查一下自己的项目是否是Spring.xm分层配置的。如果分层配置的,需......
  • Taro 项目总结
    对公司以Taro框架开发的项目进行部分总结。快速上手快速搭建Taro项目#全局安装taroclinpminstall-g@tarojs/cli#使用taro命令初始化项目taroinit[项目名称]#或者直接使用npx安装npx@tarojs/cliinit[项目名称]启动项目,查看package.json文件,其中......
  • EvoSuite使用总结
    1.安装EvoSuite插件以IDEA为例,在Plugins栏搜索EvoSuite后点击install,安装完成后重启IDEA2.使用EvoSuite选中文件右键选择RunEvoSuite生成成功可以看到如下提示:注意事项:生成路径:src/test/java使用junit4版本然后在pom.xml文件添加如下依赖:<dependency>......
  • 优化方法总结
    个人学习使用,内容来源于网络,侵权删神经网络反向传播时参数朝着最小化损失的方向前进,确切说,是朝着梯度方向更新。设神经网络参数是\(W\),学习率是\(\alpha\),网络代表的函数是\(L(W)\),那么参数更新公式可表示为:$W=W-\alpha*\bigtriangledown_WL(W)$在深度学习中,有三种最基本的梯......
  • 万字Java进阶笔记总结
    JavaApi字符串String注意:Java中“==”操作符的作用:基本数据类型:比较的是内容。引用数据类型比较的是对象的内存地址。StringBuffer/StringBuilder由于String是字符串是常量,它们的值在创建之后不能更改。如果我们使用这个String频繁进行操作,会有性能问题,这个时候就需要......
  • 浮动、bfc-规范、清除浮动总结
    介绍参考:浮动、bfc-规范、清除浮动的最佳实践#浮动、BFC规范、清除浮动的最佳实践TIP在讲CSS浮动之前,我们要现在了解下CSS布局有哪些实现机制#一、实现CSS布局的几种策略网页布局的本质是:用CSS来摆放盒子,把盒子摆放到页面对应的位置。在之前的章节我们已经详细......