首页 > 其他分享 >1.25学习进度

1.25学习进度

时间:2024-01-25 13:34:03浏览次数:31  
标签:checkpoint 存储 缓存 学习 rdd 进度 executor 1.25 内存

1.rdd的数据是过程数据

rdd之间进行相互迭代计算,当执行开启后,新rdd的产生,代表老rdd的消失

rdd的数据是过程数据,只在处理的过程中存在,一旦处理完成,就不见了

这样可以最大化的利用资源

2.rdd的缓存

sparkt提供了缓存api,可以让我们通过调用api,将指定的rdd数据保留在内存或者硬盘上

缓存特点:

    缓存技术可以将过程rdd数据,持久化保存到内存或者硬盘上,但是,这个保存再设定上认为是不安全的
    其保留rdd之间的血缘关系
    缓存时分散存储的

3.rdd的checkpoint

checkpoint存储rdd数据,是集中收集再各个分区数据进行存储,而缓存是分散存储

4.checkpoint和缓存的对比

    checkpoint不管分区数量多少,风险是一样的,缓存分区越多,风险越高
    checkpoint支持写入hdfs,缓存不行,hdfs是高可靠存储,checkpoint被认为是安全的
    checkpoint不支持内存,缓存可以,缓存如果写内存性能比checkpoint要好一些
    checkpoint在设计上认为是安全的,所以不保留血缘关系,而缓存因为设计上认为不安全,所以保留

第四章

1.jieba库可以对中文进行分词

2.由于yarn是集群运行,executor可以在所有服务器上执行,所以每个服务器都需要有哦jieba库提供支撑

3.如何尽量提高任务计算的资源

计算cpu核心和内存量,通过–executor-memory指定executor内存,通过–executor-cores指定executor的核心

通过—num-executors指定executor数量

标签:checkpoint,存储,缓存,学习,rdd,进度,executor,1.25,内存
From: https://www.cnblogs.com/zhangmingmkzj/p/17986958

相关文章

  • 云计算学习day3
    学习了Linus系统中vim命令的用法vim为创建文本/编辑文本命令(类似于word)输入vim+空格+文件名后即可创建/编辑文件点击i键即可进行编辑编辑完成后点击esc键输入:(英文)输入指令wq即可保存退出w为保存、q为退出、!为强制执行又应用vim编辑虚拟机程序使Xshell7可以连接虚拟机首......
  • [Vue]Vue3学习笔记1
    官网文档: https://cn.vuejs.org/guide/essentials/template-syntax.html 每个组件都是由createApp创建import{createApp}from'vue'constapp=createApp({/*根组件选项*/}) Vue3.4+支持v-bind同名简写如果属性名称与要绑定的JavaScript值相同,语法可以......
  • 从CF1819A学习mex相关问题及assert调试宏
    Problem-1819A-Codeforces快速计算mexintcalcMex(vector<int>v){ sort(v.begin(),v.end()); v.erase(unique(v.begin(),v.end()),v.end()) intn=int(v.size());for(inti=0;i<n;++i)if(v[i]!=i)returni;returnn;}<cass......
  • 学习Java8中StreamAPI的笔记
    本次笔记记录一下我自己学习Stream流的一个情况。第一种:使用Stream流来代替增强for循环进行赋值:这是使用增强for循环的写法:publicstaticvoidmain(String[]args){ArrayList<String>strings=newArrayList<>();strings.add("张三");strings.add("李四");strings.add......
  • 基于GoogleNet深度学习网络的花朵类型识别matlab仿真
    1.算法运行效果图预览 2.算法运行软件版本matlab2022a 3.算法理论概述      花朵类型识别是计算机视觉领域中的一个重要任务。它在植物学研究、农业、园艺等领域有着广泛的应用。传统的花朵类型识别方法通常基于手工设计的特征提取器,这些方法的效果受限于特征提......
  • 学习笔记-24.1.24
    switch(v.getId()){caseR.id.eye1:if(hide){hide=false;eye1.setImageResource(R.drawable.baseline_remove_red_eye_24);//可见样貌......
  • Django学习第一天-Flask_Web前端HTML部分
    目录1.day11.快速开发网站2.浏览器能识别的标签2.1编码2.2title2.3标题2.4div和span2.5超链接2.6图片小结2.7列表2.8表格2.9input系列(7个)2.10下拉框2.11多行文本案例:用户注册2.12网络请求目的:开发一个平台(网站)-前端开发:HTML、CSS、JavaScript-Web框架:接收并处理请求......
  • Java学习日记 Day10
    Spring框给架:AOP:AOP切面编程一般可以帮助我们在不修改现有代码的情况下,对程序的功能进行拓展,往往用于实现日志处理,权限控制,性能检测,事务控制等。JDBCtemplate:我们做好配置文件以及加入依赖后可以通过JDBCtemplate技术来简化对数据库的操作。Spring事务:实现方式主要是注......
  • 大三寒假学习进度笔记15
    今日整理了一下本次项目中使用到的技术 首先数字人方面主要使用到的是辅助神经场(nerf)算法,有关此算法的具体讲解辐射神经场算法——NeRF算法详解-CSDN博客之后是NLP,NLP的全称是NatuarlLanguageProcessing,中文意思是自然语言处理,是人工智能领域的一个重要方向自然语言处理(NL......
  • 学习记录13
    本次主要对综合案例进行了学习案例1:求TOP值任务描述:orderid,userid,payment,productidfile1.txt1,1768,50,1552,1218,600,2113,2239,788,2424,3101,28,5995,4899,290,1296,3110,54,12017,4436,259,8778,2369,7890,27file2.txt100,4287,226,233101,65......