1.25学习进度

时间：2024-01-25 13:34:03浏览次数：32

标签：checkpoint 存储缓存学习 rdd 进度 executor 1.25 内存

1.rdd的数据是过程数据

rdd之间进行相互迭代计算，当执行开启后，新rdd的产生，代表老rdd的消失

rdd的数据是过程数据，只在处理的过程中存在，一旦处理完成，就不见了

这样可以最大化的利用资源

2.rdd的缓存

sparkt提供了缓存api，可以让我们通过调用api，将指定的rdd数据保留在内存或者硬盘上

缓存特点：

    缓存技术可以将过程rdd数据，持久化保存到内存或者硬盘上，但是，这个保存再设定上认为是不安全的
    其保留rdd之间的血缘关系
    缓存时分散存储的

3.rdd的checkpoint

checkpoint存储rdd数据，是集中收集再各个分区数据进行存储，而缓存是分散存储

4.checkpoint和缓存的对比

    checkpoint不管分区数量多少，风险是一样的，缓存分区越多，风险越高
    checkpoint支持写入hdfs，缓存不行，hdfs是高可靠存储，checkpoint被认为是安全的
    checkpoint不支持内存，缓存可以，缓存如果写内存性能比checkpoint要好一些
    checkpoint在设计上认为是安全的，所以不保留血缘关系，而缓存因为设计上认为不安全，所以保留

第四章

1.jieba库可以对中文进行分词

2.由于yarn是集群运行，executor可以在所有服务器上执行，所以每个服务器都需要有哦jieba库提供支撑

3.如何尽量提高任务计算的资源

计算cpu核心和内存量，通过–executor-memory指定executor内存，通过–executor-cores指定executor的核心

通过—num-executors指定executor数量

标签：checkpoint,存储,缓存,学习,rdd,进度,executor,1.25,内存
From： https://www.cnblogs.com/zhangmingmkzj/p/17986958

云计算学习day3
学习了Linus系统中vim命令的用法vim为创建文本/编辑文本命令（类似于word）输入vim+空格+文件名后即可创建/编辑文件点击i键即可进行编辑编辑完成后点击esc键输入：（英文）输入指令wq即可保存退出w为保存、q为退出、！为强制执行又应用vim编辑虚拟机程序使Xshell7可以连接虚拟机首......
[Vue]Vue3学习笔记1
官网文档： https://cn.vuejs.org/guide/essentials/template-syntax.html 每个组件都是由createApp创建import{createApp}from'vue'constapp=createApp({/*根组件选项*/}) Vue3.4+支持v-bind同名简写如果属性名称与要绑定的JavaScript值相同，语法可以......
从CF1819A学习mex相关问题及assert调试宏
Problem-1819A-Codeforces快速计算mexintcalcMex(vector<int>v){ sort(v.begin(),v.end()); v.erase(unique(v.begin(),v.end()),v.end()) intn=int(v.size());for(inti=0;i<n;++i)if(v[i]!=i)returni;returnn;}<cass......
学习Java8中StreamAPI的笔记
本次笔记记录一下我自己学习Stream流的一个情况。第一种：使用Stream流来代替增强for循环进行赋值：这是使用增强for循环的写法：publicstaticvoidmain(String[]args){ArrayList<String>strings=newArrayList<>();strings.add("张三");strings.add("李四");strings.add......
基于GoogleNet深度学习网络的花朵类型识别matlab仿真
1.算法运行效果图预览 2.算法运行软件版本matlab2022a 3.算法理论概述花朵类型识别是计算机视觉领域中的一个重要任务。它在植物学研究、农业、园艺等领域有着广泛的应用。传统的花朵类型识别方法通常基于手工设计的特征提取器，这些方法的效果受限于特征提......
学习笔记-24.1.24
switch(v.getId()){caseR.id.eye1:if(hide){hide=false;eye1.setImageResource(R.drawable.baseline_remove_red_eye_24);//可见样貌......
Django学习第一天-Flask_Web前端HTML部分
目录1.day11.快速开发网站2.浏览器能识别的标签2.1编码2.2title2.3标题2.4div和span2.5超链接2.6图片小结2.7列表2.8表格2.9input系列（7个）2.10下拉框2.11多行文本案例：用户注册2.12网络请求目的：开发一个平台（网站）-前端开发：HTML、CSS、JavaScript-Web框架：接收并处理请求......
Java学习日记 Day10
Spring框给架：AOP:AOP切面编程一般可以帮助我们在不修改现有代码的情况下,对程序的功能进行拓展,往往用于实现日志处理,权限控制,性能检测,事务控制等。JDBCtemplate:我们做好配置文件以及加入依赖后可以通过JDBCtemplate技术来简化对数据库的操作。Spring事务：实现方式主要是注......
大三寒假学习进度笔记15
今日整理了一下本次项目中使用到的技术首先数字人方面主要使用到的是辅助神经场（nerf）算法，有关此算法的具体讲解辐射神经场算法——NeRF算法详解-CSDN博客之后是NLP，NLP的全称是NatuarlLanguageProcessing，中文意思是自然语言处理，是人工智能领域的一个重要方向自然语言处理（NL......
学习记录13
本次主要对综合案例进行了学习案例1：求TOP值任务描述：orderid,userid,payment,productidfile1.txt1,1768,50,1552,1218,600,2113,2239,788,2424,3101,28,5995,4899,290,1296,3110,54,12017,4436,259,8778,2369,7890,27file2.txt100,4287,226,233101,65......

1.25学习进度

相关文章

赞助商

阅读排行