今日总结

今日总结

时间：2024-02-26 22:13:55浏览次数：24

标签：总结 Task 分区 Worker RDD Job Executor 今日

Master和Worker

在Spark中，Master是独立集群的控制者，而Worker是工作者。一个Spark独立集群需要启动一个Master和多个Worker。Worker就是物理节点，可以在上面启动Executor进程。

Executor

在每个Worker上为某应用启动的一个进程，该进程负责运行Task，并且负责将数据存在内存或者磁盘上，每个任务都有各自独立的Executor。Executor是一个执行Task的容器。实际上它是一组计算资源(cpu核心、memory)的集合。

一个Worker节点可以有多个Executor。一个Executor可以运行多个Task。

executor创建成功后，在日志文件会显示如下信息： INFO Executor: Starting executor ID [executorId] on host [executorHostname]

Job

一个Job包含多个RDD及作用于相应RDD上的各种操作，每个Action的触发就会生成一个job。用户提交的Job会提交给DAGScheduler，Job会被分解成Stage，Stage会被细化成Task。

Task

被发送到executor上的工作单元。每个Task负责计算一个分区的数据。

Stage

在 Spark 中，一个作业（job）会被划分为多个阶段（stage）。同一个 Stage 可以有多个 Task 并行执行(task 数=分区数）。

阶段之间的划分是根据数据的依赖关系来确定的。当一个 RDD 的分区依赖于另一个 RDD 的分区时，这两个 RDD 就属于同一个阶段。当一个 RDD 的分区依赖于多个 RDD 的分区时，这些 RDD 就属于不同的阶段。

标签：总结,Task,分区,Worker,RDD,Job,Executor,今日
From： https://www.cnblogs.com/zhaoyueheng/p/18035699

近期总结 2024.2.26
dp专场*2。CF1608FMEXCounting题意：给出$n,m,b_{1...n}$，求出有多少个长度为$n$的序列$a$满足$\foralli\in[1,n],\space0\lea_i\len$且$|\operatorname{mex}\{a_1,a_2,...,a_i\}-b_i|\lem$。$1\len\le2000,\space1\lek\le50$很简单的......
比赛总结录
比赛总结录【寒假集训】20240206测试90/400T1.珠子题目链接0/100思路：双指针，赛场上想到了，但是没有打出来代码。T2.数组题目链接0/100思路：暴力+记录。赛场上也想到了，但是赛场上忽略了一个点。又因为多打了几行而丢了$40pts$。T3.幸运区间题目链接60/100思......
补上之前空缺的总结，另外反思一下自己
前几天学习了javase的方法，其实挺简单的，就类似于学习c++的时候用的函数，是解决一类问题的步骤。不过要注意的是方法包括在类或对象中，这一点与c++是肯定不同的，因为java更加面向对象，在编写方法时要注意，一个方法最好用于解决一个问题，实现一个功能，方法的格式是修饰+类型+方法名+实现部分......
Spring Boot 信息泄露总结
1.目标2.微信sessionkey泄露导致任意用户登录点击快捷登录，发现可以使用手机号进行登录发现sessionkey，使用工具利用没有账号，尝试13111111111(一般测试账号是这个),成功登录 3.进行指纹识别，发现为SpringBoot框架,测试发现SpringActuator信息泄露 4.发现actuator/gate......
SSH框架使用AOP代理+自定义注解遇到的相关问题总结
1、AOP注解失效问题编写完成注解和AOP切面类时，在controller中加上注解，注解不生效。在配置文件xml中开启AOP注解：<aop:aspectj-autoproxyproxy-target-class="true"/>如果该配置以加在项目里，但是还是不生效。需要检查一下自己的项目是否是Spring.xm分层配置的。如果分层配置的，需......
Taro 项目总结
对公司以Taro框架开发的项目进行部分总结。快速上手快速搭建Taro项目#全局安装taroclinpminstall-g@tarojs/cli#使用taro命令初始化项目taroinit[项目名称]#或者直接使用npx安装npx@tarojs/cliinit[项目名称]启动项目，查看package.json文件，其中......
EvoSuite使用总结
1.安装EvoSuite插件以IDEA为例，在Plugins栏搜索EvoSuite后点击install，安装完成后重启IDEA2.使用EvoSuite选中文件右键选择RunEvoSuite生成成功可以看到如下提示：注意事项：生成路径：src/test/java使用junit4版本然后在pom.xml文件添加如下依赖：<dependency>......
优化方法总结
个人学习使用，内容来源于网络，侵权删神经网络反向传播时参数朝着最小化损失的方向前进，确切说，是朝着梯度方向更新。设神经网络参数是$W$，学习率是$\alpha$，网络代表的函数是$L(W)$，那么参数更新公式可表示为：$W=W-\alpha*\bigtriangledown_WL(W)$在深度学习中，有三种最基本的梯......
万字Java进阶笔记总结
JavaApi字符串String注意：Java中“==”操作符的作用：基本数据类型：比较的是内容。引用数据类型比较的是对象的内存地址。StringBuffer/StringBuilder由于String是字符串是常量，它们的值在创建之后不能更改。如果我们使用这个String频繁进行操作，会有性能问题，这个时候就需要......
浮动、bfc-规范、清除浮动总结
介绍参考：浮动、bfc-规范、清除浮动的最佳实践#浮动、BFC规范、清除浮动的最佳实践TIP在讲CSS浮动之前，我们要现在了解下CSS布局有哪些实现机制#一、实现CSS布局的几种策略网页布局的本质是：用CSS来摆放盒子，把盒子摆放到页面对应的位置。在之前的章节我们已经详细......

Master和Worker

Executor

Job

Task

Stage

相关文章

赞助商

阅读排行