首页 > 其他分享 >10.29

10.29

时间:2024-10-30 13:47:06浏览次数:3  
标签:Scala 10.29 Hadoop 多选题 RDD 单选题 Spark

大型数据库技术作业七

 

一. 单选题(共5题,10分)

1. (单选题, 2分) 在实际应用中,大数据处理不包括哪些类型?

  A

基于实时数据流的数据处理

B

基于离线数据的处理

C

复杂的批量数据处理

D

基于历史数据的交互式查询

2. (单选题, 2分) 下列关于Spark的描述,错误的是哪一项?

  A

Spark最初由美国加州伯克利大学(UCBerkeley)的AMP实验室于2009年开发

B

Spark在2014年打破了Hadoop保持的基准排序纪录.

C

Spark用十分之一的计算资源,获得了比Hadoop快3倍的速度

D

Spark运行模式单一

3. (单选题, 2分) 下列说法哪项有误?

  A

相对于Spark来说,使用Hadoop进行迭代计算非常耗资源

B

Spark将数据载入内存后,之后的迭代计算都可以直接使用内存中的中间结果作运算,避免了从磁盘中频繁读取数据

C

Hadoop的设计遵循“一个软件栈满足不同应用场景”的理念

D

Spark可以部署在资源管理器YARN之上,提供一站式的大数据解决方案

4. (单选题, 2分) 下列说法错误的是?

  A

RDD(Resillient Distributed Dataset)是运行在工作节点(WorkerNode)的一个进程,负责运行Task

B

Application是用户编写的Spark应用程序

C

一个Job包含多个RDD及作用于相应RDD上的各种操作

D

Directed Acyclic Graph反映RDD之间的依赖关

5. (单选题, 2分) 下列关于RDD说法,描述有误的是?

  A

一个RDD就是一个分布式对象集合,本质上是一个只读的分区记录集合

B

每个RDD可分成多个分区,每个分区就是一个数据集片段

C

RDD是可以直接修改的

D

RDD提供了一种高度受限的共享内存模型

二. 多选题(共5题,10分)

6. (多选题, 2分) Apache软件基金会最重要的三大分布式计算系统开源项目

  A

Hadoop

B

Spark

C

Storm

D

Hive

7. (多选题, 2分) Spark具有的主要特点包括:

  A

运行模式多样

B

运行速度快

C

容易使用

D

通用性

8. (多选题, 2分) Scala的特性包括:

  A

Scala具备强大的并发性

B

Scala语法复杂

C

Scala兼容Java

D

运行速度快

9. (多选题, 2分) Spark最主要的优点是()

  A

计算模式只能是MapReduce

B

Spark提供了内存计算

C

提供了单一数据集操作类型

D

基于DAG的任务调度执行机制

10. (多选题, 2分) Spark所采用Executor的优点包括:

  A

利用多线程来执行具体的任务

B

多线程之间的数据共享

C

存储模块全部都只能在内存中完成

D

Executor中有一个BlockManager存储模块,有效减少IO开销

三. 简答题(共1题,20分)

11. (简答题, 20分) 以下题目二选一: 1、请写出三个大数据在人类生活中应用的实例,并谈谈自己对大数据的看法。 2、编程实践:参考教程https://dblab.xmu.edu.cn/blog/4322/,任意选择以下一种方式通过Spark API 编写一个独立应用程序。 (一)使用sbt对Scala独立应用程序进行编译打包 (二)使用Maven对Java独立应用程序进行编译打包 (三)使用Maven对Scala独立应用程序进行编译打包 并截图给出代码及运行结果。

 

 

 

 

 

标签:Scala,10.29,Hadoop,多选题,RDD,单选题,Spark
From: https://www.cnblogs.com/zzqq1314/p/18515713

相关文章

  • 2024.10.29模拟赛
    今天照常7:45开始打模拟赛,11:45时结束。打了T1的40分暴力、T3的20分暴力,没有注意到T4的特殊样例可以骗分(悲),最后以60分收尾。总结一下,没有挂分,但也没和正解挨上边,算是不好也不坏吧。订题时我看着T126行的AC代码陷入了沉思。三个人,想了至少三个小时,结果全没想出来,于是来整理一下今......
  • 10.29
    距离NOIP2024还有31天arc181_c:按行的字典序大小,每一行比上一行多一个\(1\),选在未选过的列的字典序最大的那一列。arc180_b贪心感觉很妙,但是感觉还是官解比较好理解。我们定义序列\(pos\),满足\(pos_{p_i}=i\),那么每次交换其实就是找一对\((i,j)\)满足\(1\lei<j\le......
  • 10.29每日总结:《程序员修炼之道》读后感2
    经过这一阶段的阅读,我对程序员这个职业有了更深的理解和感悟。这本书强调了许多重要的理念和实践方法,让我认识到作为一名程序员,不能仅仅满足于编写代码,更要注重自身的修炼和成长。它提醒我们要保持对技术的好奇心,不断学习新的知识和技能,以适应快速变化的行业需求。书中提到的“......
  • 10.29 人工智能学习内容
    上节课内容补充【给大语言模型法阅读材料】如果你手边现成有原文,而且长度合适,建议自带原文去找大语言模型Usetheprovidedarticlesdelimitedbytriplequotestoanswerquestions.Iftheanswercannotbefoundinthearticles,write"Icouldnotfindananswer."......
  • 2024.10.29 test
    A已知\(n\)边形的一个三角剖分,你可以进行若干次“城市建造”操作,可以选择三个点并新建一个点为这三个点的内心并连边。构造方案,使得城市建造次数最少,且新图可以划分为两棵树。只需要进行一次城市建造操作,就可以使边数变为\(2n\),点数为\(n+1\),显然即可划分。考虑取出一个三......
  • 24.10.29
    A记少加一个取地址符怒挂90pts。虽然本身也不是正解吧。先用A造个线性姬,然后用这个线性姬把剩下的数变成B,再用处理好的部分造线性姬,回头处理A。上面这个在\(n\)较大的时候表现良好,因为用B可以造出一个完整的线性基。上面是没加取地址符挂的90pts。(下面的东西大概......
  • 2024.10.29
    1.reverse函数:翻转对于数组a,a+n;对于字符串或者向量a.begin(),a.end();具体在https://blog.csdn.net/YMWM_/article/details/1154682972.字符串的一种赋值方式点击查看代码for(inti=0;i<n;i++)s[i]=string(7*n/2,'')其中s[]=string(数量,'')是说将s[]这一行赋值为......
  • 10.29随笔
    这里是10.29随笔。这里留一下今天写的代码,用队列实现回文:includeincludeincludeboolisPalindrome(conststd::string&str){intleft=0;intright=str.size()-1;while(left<right){while(left<right&&isspace(str[left])){++left;......
  • 10.29
    软件设计                 石家庄铁道大学信息学院 实验4:抽象工厂模式本次实验属于模仿型实验,通过本次实验学生将掌握以下内容:1、理解抽象工厂模式的动机,掌握该模式的结构;2、能够利用抽象工厂模式解决实际问题。 [实验任务一]:人与肤色使用抽象工厂模......
  • 10.29 视图
    数据库之视图(一)视图的介绍=============================一、什么是视图?视图是一个虚拟表,它是一个虚拟表,它不在数据库中以存储的形式保存(本身不包含数据),是在使用视图的时候动态生成。二、视图的优点?1、提高查询效率数据库中的数据查询非常复杂,可以简化sql语句2、安全有些......