首页 > 其他分享 >spark总结

spark总结

时间:2024-02-27 18:00:10浏览次数:202  
标签:总结 Scala 提供 开发人员 计算 组件 spark Spark

Spark是什么

学习一个东西之前总要知道这个东西是什么。

Spark 是一个开源的大数据处理引擎,它提供了一整套开发 API,包括流计算和机器学习。它支持批处理和流处理。

Spark 的一个显著特点是它能够在内存中进行迭代计算,从而加快数据处理速度。尽管 Spark 是用 Scala 开发的,但它也为 Java、Scala、Python 和 R 等高级编程语言提供了开发接口。

Spark组件

Spark提供了6大组件:

  • Spark Core
  • Spark SQL
  • Spark Streaming
  • Spark MLlib
  • Spark GraphX
  • Spark的优势

    Spark 有许多优势,其中一些主要优势包括:

    • 速度:Spark 基于内存计算,能够比基于磁盘的计算快很多。对于迭代式算法和交互式数据挖掘任务,这种速度优势尤为明显。
    • 易用性:Spark 支持多种语言,包括 Java、Scala、Python 和 R。它提供了丰富的内置 API,可以帮助开发人员更快地构建和运行应用程序。
    • 通用性:Spark 提供了多种组件,可以支持不同类型的计算任务,包括批处理、交互式查询、流处理、机器学习和图形处理等。
    • 兼容性:Spark 可以与多种数据源集成,包括 Hadoop 分布式文件系统(HDFS)、Apache Cassandra、Apache HBase 和 Amazon S3 等。
    • 容错性:Spark 提供了弹性分布式数据集(RDD)抽象,可以帮助开发人员更快地构建容错应用程序。

标签:总结,Scala,提供,开发人员,计算,组件,spark,Spark
From: https://www.cnblogs.com/222wan/p/17433298.html

相关文章

  • 毕设6:总结
    呃好久没写了感觉没什么好写的,然后做完了(1.List的add只是一个接口,并没有实现,各种操作请认准arraylist。2.关于Task一个JavaFX异步执行的类,但请单独开一个线程给它不然还是同步的。3.关于TreeView界面乱跳的问题treeitemexpend的时候会展示父节点和尽量多的子节点,但可能是......
  • Scala学习总结(三)
    Scala学习总结六、集合1.Scala集合的特点Java集合:三大类型:列表List、集合Set、映射Map,有多种不同实现。Scala集合:三大类型:序列Seq,集合Set,映射Map,所有集合都扩展自Iterable。对于几乎所有集合类,都同时提供可变和不可变版本。不可变集合:scala.collec......
  • 2.27每日总结
    今天课上学习了软件测试技术,对软件测试技术有了简单的了解。软件测试技术是一门涉及软件质量保证和验证的课程,旨在教授学生如何设计、执行和评估软件测试方案以确保软件系统的质量。这门课程通常涵盖以下内容:软件测试基础知识:介绍软件测试的基本概念、原则和方法论,包括白盒测......
  • spark-rdd
    分布式集合对象上的API称之为算子算子分为两类:transformation算子:指返回值仍然是rdd,类似于stream里的中间流这类算子与中间流相同,是懒加载的action算子:返回值不是rdd,类似于stream里的终结流常见算子:transformation算子1.map(func):将rdd的数据一条一条的处理,返回新......
  • 今日总结
    Master和Worker在Spark中,Master是独立集群的控制者,而Worker是工作者。一个Spark独立集群需要启动一个Master和多个Worker。Worker就是物理节点,可以在上面启动Executor进程。Executor在每个Worker上为某应用启动的一个进程,该进程负责运行Task,并且负责将数据存在内存或者磁盘上,每......
  • 近期总结 2024.2.26
    dp专场*2。CF1608FMEXCounting题意:给出\(n,m,b_{1...n}\),求出有多少个长度为\(n\)的序列\(a\)满足\(\foralli\in[1,n],\space0\lea_i\len\)且\(|\operatorname{mex}\{a_1,a_2,...,a_i\}-b_i|\lem\)。\(1\len\le2000,\space1\lek\le50\)很简单的......
  • 比赛总结录
    比赛总结录【寒假集训】20240206测试90/400T1.珠子题目链接0/100思路:双指针,赛场上想到了,但是没有打出来代码。T2.数组题目链接0/100思路:暴力+记录。赛场上也想到了,但是赛场上忽略了一个点。又因为多打了几行而丢了$40pts$。T3.幸运区间题目链接60/100思......
  • 补上之前空缺的总结,另外反思一下自己
    前几天学习了javase的方法,其实挺简单的,就类似于学习c++的时候用的函数,是解决一类问题的步骤。不过要注意的是方法包括在类或对象中,这一点与c++是肯定不同的,因为java更加面向对象,在编写方法时要注意,一个方法最好用于解决一个问题,实现一个功能,方法的格式是修饰+类型+方法名+实现部分......
  • Spring Boot 信息泄露总结
    1.目标2.微信sessionkey泄露导致任意用户登录点击快捷登录,发现可以使用手机号进行登录发现sessionkey,使用工具利用没有账号,尝试13111111111(一般测试账号是这个),成功登录 3.进行指纹识别,发现为SpringBoot框架,测试发现SpringActuator信息泄露 4.发现actuator/gate......
  • SSH框架使用AOP代理+自定义注解遇到的相关问题总结
    1、AOP注解失效问题编写完成注解和AOP切面类时,在controller中加上注解,注解不生效。在配置文件xml中开启AOP注解:<aop:aspectj-autoproxyproxy-target-class="true"/>如果该配置以加在项目里,但是还是不生效。需要检查一下自己的项目是否是Spring.xm分层配置的。如果分层配置的,需......