10.29

10.29

时间：2024-10-30 13:47:06浏览次数：3

标签：Scala 10.29 Hadoop 多选题 RDD 单选题 Spark

大型数据库技术作业七

一. 单选题（共5题，10分）

1. (单选题, 2分) 在实际应用中，大数据处理不包括哪些类型？

基于实时数据流的数据处理

基于离线数据的处理

复杂的批量数据处理

基于历史数据的交互式查询

2. (单选题, 2分) 下列关于Spark的描述，错误的是哪一项？

Spark最初由美国加州伯克利大学（UCBerkeley）的AMP实验室于2009年开发

Spark在2014年打破了Hadoop保持的基准排序纪录.

Spark用十分之一的计算资源，获得了比Hadoop快3倍的速度

Spark运行模式单一

3. (单选题, 2分) 下列说法哪项有误？

相对于Spark来说，使用Hadoop进行迭代计算非常耗资源

Spark将数据载入内存后，之后的迭代计算都可以直接使用内存中的中间结果作运算，避免了从磁盘中频繁读取数据

Hadoop的设计遵循“一个软件栈满足不同应用场景”的理念

Spark可以部署在资源管理器YARN之上，提供一站式的大数据解决方案

4. (单选题, 2分) 下列说法错误的是？

RDD（Resillient Distributed Dataset）是运行在工作节点（WorkerNode）的一个进程，负责运行Task

Application是用户编写的Spark应用程序

一个Job包含多个RDD及作用于相应RDD上的各种操作

Directed Acyclic Graph反映RDD之间的依赖关

5. (单选题, 2分) 下列关于RDD说法，描述有误的是？

一个RDD就是一个分布式对象集合，本质上是一个只读的分区记录集合

每个RDD可分成多个分区，每个分区就是一个数据集片段

RDD是可以直接修改的

RDD提供了一种高度受限的共享内存模型

二. 多选题（共5题，10分）

6. (多选题, 2分) Apache软件基金会最重要的三大分布式计算系统开源项目

Hadoop

Spark

Storm

Hive

7. (多选题, 2分) Spark具有的主要特点包括：

运行模式多样

运行速度快

容易使用

通用性

8. (多选题, 2分) Scala的特性包括：

Scala具备强大的并发性

Scala语法复杂

Scala兼容Java

运行速度快

9. (多选题, 2分) Spark最主要的优点是（）

计算模式只能是MapReduce

Spark提供了内存计算

提供了单一数据集操作类型

基于DAG的任务调度执行机制

10. (多选题, 2分) Spark所采用Executor的优点包括：

利用多线程来执行具体的任务

多线程之间的数据共享

存储模块全部都只能在内存中完成

Executor中有一个BlockManager存储模块，有效减少IO开销

三. 简答题（共1题，20分）

11. (简答题, 20分) 以下题目二选一： 1、请写出三个大数据在人类生活中应用的实例，并谈谈自己对大数据的看法。 2、编程实践：参考教程https://dblab.xmu.edu.cn/blog/4322/，任意选择以下一种方式通过Spark API 编写一个独立应用程序。（一）使用sbt对Scala独立应用程序进行编译打包（二）使用Maven对Java独立应用程序进行编译打包（三）使用Maven对Scala独立应用程序进行编译打包并截图给出代码及运行结果。

标签：Scala,10.29,Hadoop,多选题,RDD,单选题,Spark
From： https://www.cnblogs.com/zzqq1314/p/18515713

2024.10.29模拟赛
今天照常7:45开始打模拟赛，11:45时结束。打了T1的40分暴力、T3的20分暴力，没有注意到T4的特殊样例可以骗分（悲），最后以60分收尾。总结一下，没有挂分，但也没和正解挨上边，算是不好也不坏吧。订题时我看着T126行的AC代码陷入了沉思。三个人，想了至少三个小时，结果全没想出来，于是来整理一下今......
10.29
距离NOIP2024还有31天arc181_c：按行的字典序大小，每一行比上一行多一个\(1\)，选在未选过的列的字典序最大的那一列。arc180_b贪心感觉很妙，但是感觉还是官解比较好理解。我们定义序列\(pos\)，满足\(pos_{p_i}=i\)，那么每次交换其实就是找一对\((i,j)\)满足\(1\lei<j\le......
10.29每日总结：《程序员修炼之道》读后感2
经过这一阶段的阅读，我对程序员这个职业有了更深的理解和感悟。这本书强调了许多重要的理念和实践方法，让我认识到作为一名程序员，不能仅仅满足于编写代码，更要注重自身的修炼和成长。它提醒我们要保持对技术的好奇心，不断学习新的知识和技能，以适应快速变化的行业需求。书中提到的“......
10.29 人工智能学习内容
上节课内容补充【给大语言模型法阅读材料】如果你手边现成有原文，而且长度合适，建议自带原文去找大语言模型Usetheprovidedarticlesdelimitedbytriplequotestoanswerquestions.Iftheanswercannotbefoundinthearticles,write"Icouldnotfindananswer."......
2024.10.29 test
A已知\(n\)边形的一个三角剖分，你可以进行若干次“城市建造”操作，可以选择三个点并新建一个点为这三个点的内心并连边。构造方案，使得城市建造次数最少，且新图可以划分为两棵树。只需要进行一次城市建造操作，就可以使边数变为\(2n\)，点数为\(n+1\)，显然即可划分。考虑取出一个三......
24.10.29
A记少加一个取地址符怒挂90pts。虽然本身也不是正解吧。先用A造个线性姬，然后用这个线性姬把剩下的数变成B，再用处理好的部分造线性姬，回头处理A。上面这个在\(n\)较大的时候表现良好，因为用B可以造出一个完整的线性基。上面是没加取地址符挂的90pts。（下面的东西大概......
2024.10.29
1.reverse函数：翻转对于数组a，a+n；对于字符串或者向量a.begin(),a.end();具体在https://blog.csdn.net/YMWM_/article/details/1154682972.字符串的一种赋值方式点击查看代码for(inti=0;i<n;i++)s[i]=string(7*n/2,'')其中s[]=string(数量,'')是说将s[]这一行赋值为......
10.29随笔
这里是10.29随笔。这里留一下今天写的代码，用队列实现回文：includeincludeincludeboolisPalindrome(conststd::string&str){intleft=0;intright=str.size()-1;while(left<right){while(left<right&&isspace(str[left])){++left;......
10.29
软件设计石家庄铁道大学信息学院实验4：抽象工厂模式本次实验属于模仿型实验，通过本次实验学生将掌握以下内容：1、理解抽象工厂模式的动机，掌握该模式的结构；2、能够利用抽象工厂模式解决实际问题。 [实验任务一]：人与肤色使用抽象工厂模......
10.29 视图
数据库之视图（一）视图的介绍=============================一、什么是视图？视图是一个虚拟表，它是一个虚拟表，它不在数据库中以存储的形式保存（本身不包含数据），是在使用视图的时候动态生成。二、视图的优点？1、提高查询效率数据库中的数据查询非常复杂，可以简化sql语句2、安全有些......