首页 > 其他分享 >10.16

10.16

时间:2024-10-16 17:43:34浏览次数:6  
标签:Map Task Reduce MapReduce TaskTracker 单选题 10.16

一. 单选题(共8题,16分)

1. (单选题, 2分) 下列传统并行计算框架,说法错误的是哪一项?

  A

刀片服务器、高速网、SAN,价格贵,扩展性差上

B

共享式(共享内存/共享存储),容错性好

C

编程难度高

D

实时、细粒度计算、计算密集型

2. (单选题, 2分) 下列关于MapReduce模型的描述,错误的是哪一项?

  A

MapReduce采用“ 分而治之”策略

B

MapReduce设计的一个理念就是“ 计算向数据靠拢”

C

MapReduce框架采用了Master/Slave架构

D

MapReduce应用程序只能用Java来写

3. (单选题, 2分) MapReduce1.0的体系结构中,JobTracker是主要任务是什么?

  A

负责资源监控和作业调度,监控所有TaskTracker与Job的健康状况

B

使用“slot”等量划分本节点上的资源量(CPU、内存等)

C

会周期性地通过“心跳”将本节点上资源的使用情况和任务的运行进度汇报给TaskTracker

D

会跟踪任务的执行进度、资源使用量等信息,并将这些信息告诉任务(Task)

4. (单选题, 2分) 下列关于MapReduce工作流程,哪个描述是正确的?

  A

所有的数据交换都是通过MapReduce框架自身去实现的

B

不同的Map任务之间会进行通信

C

不同的Reduce任务之间可以发生信息交换

D

用户可以显式地从一台机器向另一台机器发送消息

5. (单选题, 2分) 下列关于MapReduce的说法,哪个描述是错误的?

  A

MapReduce具有广泛的应用,比如关系代数运算、分组与聚合运算等

B

MapReduce将复杂的、运行于大规模集群上的并行计算过程高度地抽象到了两个函数

C

编程人员在不会分布式并行编程的情况下,也可以很容易将自己的程序运行在分布式系统上,完成海量数据集的计算

D

不同的Map任务之间可以进行通信

6. (单选题, 2分) 下列关于Map和Reduce函数的描述,哪个是错误的?

  A

Map将小数据集进一步解析成一批对,输入Map函数中进行处理

B

Map每一个输入的会输出一批。是计算的中间结果

C

Reduce输入的中间结果中的List(v 2 )表示是一批属于不同k 2 的value

D

Reduce输入的中间结果中的List(v 2 )表示是一批属于同一个k 2 的value

7. (单选题, 2分) 关于MapReduce1.0的体系结构的描述,下列说法错误的是?

  A

Task 分为Map Task 和Reduce Task 两种,分别由JobTracker 和TaskTracker 启动

B

slot 分为Map slot 和Reduce slot 两种,分别供MapTask 和Reduce Task 使用

C

TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)

D

TaskTracker 会周期性接收JobTracker 发送过来的命令并执行相应的操作(如启动新任务、杀死任务等)

8. (单选题, 2分) 下列说法错误的是?

  A

Hadoop MapReduce是MapReduce的开源实现,后者比前者使用门槛低很多

B

MapReduce采用非共享式架构,容错性好

C

MapReduce主要用于批处理、实时、计算密集型应用

D

MapReduce采用“ 分而治之”策略

二. 多选题(共6题,16分)

9. (多选题, 2.6分) MapReduce相较于传统的并行计算框架有什么优势?

  A

非共享式,容错性好

B

普通PC机,便宜,扩展性好

C

编程简单,只要告诉MapReduce做什么即可

D

批处理、非实时、数据密集型

10. (多选题, 2.6分) MapReduce体系结构主要由以下哪几个部分构成?

  A

Client

B

JobTracker

C

TaskTracker

D

Task

11. (多选题, 2.7分) 下列关于MapReduce的体系结构的描述,说法正确的有?

  A

用户编写的MapReduce程序通过Client提交到JobTracker端

B

JobTracker负责资源监控和作业调度

C

TaskTracker监控所有TaskTracker与Job的健康状况

D

TaskTracker 使用“slot”等量划分本节点上的资源量(CPU、内存等)

12. (多选题, 2.7分) 下列关于Map 端的Shuffle的描述,哪些是正确的?

  A

当数据很少时,不需要溢写到磁盘,直接在缓存中归并,然后输出给Reduce

B

MapReduce默认为每个Map任务分配1000MB缓存

C

多个溢写文件归并成一个或多个大文件,文件中的键值对是排序的

D

每个Map任务分配多个缓存,使得任务运行更有效率

13. (多选题, 2.7分) MapReduce执行的全过程包括以下哪几个主要阶段?

  A

从分布式文件系统读入数据

B

执行Map任务输出中间结果

C

通过 Shuffle阶段把中间结果分区排序整理后发送给Reduce任务

D

执行Reduce任务得到最终结果并写入分布式文件系统

14. (多选题, 2.7分) 下列说法正确的是?

  A

MapReduce体系结构主要由四个部分组成,分别是:Client、JobTracker、TaskTracker以及Task

B

Task 分为Map Task 和Reduce Task 两种,均由TaskTracker 启动

C

在MapReduce工作流程中,所有的数据交换都是通过MapReduce框架自身去实现的

D

在MapReduce工作流程中,用户不能显式地从一台机器向另一台机器发送消息

三. 简答题(共1题,20分)

15. (简答题, 20分) 请在以下两题中任选一题作答: (1)通过查阅资料,写出一个或多个MapReduce的具体应用,并谈谈自己对MapReduce的认识。(满分10分) (2)词频统计任务编程实践,任务要求:在Linux系统本地创建两个文件,即文件wordfile1.txt和wordfile2.txt,文件wordfile1.txt的内容格式如下,需要将zhangsan换成自己名字的英文全拼: zhangsan loves Spark zhangsan loves Hadoop 文件wordfile2.txt的内容如下: Hadoop is good Spark is fast 请对这两个小数据集样本编写MapReduce词频统计程序,并截图给出统计结果,可参考相关教程https://dblab.xmu.edu.cn/blog/2481/。(满分20分)

 

标签:Map,Task,Reduce,MapReduce,TaskTracker,单选题,10.16
From: https://www.cnblogs.com/zzqq1314/p/18470466

相关文章

  • 10.16
    A判断完是决策单调性之后决定回来写(埋下伏笔),B的题面不好看直接跳了,发现C是小清新数据结构,一个小时内会了,又断断续续写了三个小时,最后剩20min急忙码完A的暴力。60+0+90鉴定为菜就多练。A.共享单车决策单调性板题,\(O(n^2k)\)暴力,打个表,发现决策单调性,套上来就行了。B.......
  • 10.16
    java完成栈回文操作importjava.util.Stack;importjava.util.Scanner;publicclassMain{publicstaticbooleanisPalindrome(Stringstr){//使用栈存储字符串的字符Stack<Character>stack=newStack<>();//将字符串的每个字符压入栈中for(char......
  • 2024.10.16总结
    本文于github博客同步更新。A:打表发现有决策单调性,考虑人类智慧,每次向后跳\(rand\%200\)个点,若更优则继续跳,然后就过了。正解是这样写的:设\(p[i\)]为当前层的最优决策点,把决策按顺序加入,同时更新\(p[i]\)把相同的\(p[i]\)合并成一个点,对这些点维护栈,每加入一个决策......
  • 永久白嫖AWS云服务器,验证、注册指南【2024.10.16亲测可用】
    背景不知道你想不想拥有一台属于自己的云服务器呢,拥有一台自己的云服务器可以建站,可以在上面搭建个人博客,今天我就来教大家如何申请亚马逊AWS免费云服务器,这个云服务器可以长达12个月的免费。而且到期后可以继续换个账号继续白嫖。(不过呢在注册的时候是需要信用卡的,实测国......
  • 闲话 10.16
    今日第一蚌StepstoOne已同步更新于莫比乌斯反演。CF1139D用到一点莫反也是莫反。题目大意:每次从\(\left[1,n\right]\)随机取一个数加入数组\(a_i\),当\(gcd_{i=1}^{len}\a_i=1\)时停止,问\(len\)的期望。直接用期望式子推:\[\begin{aligned}ans&=\sum_{i=1}......
  • 10.16
    今天我主要学习了Java中的异常处理知识。通过编写一个简单的程序,我了解了如何使用try-catch语句来处理异常,以及如何使用finally语句来确保资源的正确释放。此外,我还了解到使用二分法查找可以优化多次比较的算法,提高程序的运行效率。在实践中,我遇到了一些困难。例如,在Web界面中实......
  • 10.16
    在MySQL中,可以使用ALTERDATABASE来修改已经被创建或者存在的数据库的相关参数。修改数据库的语法格式为:ALTERDATABASE[数据库名]{[DEFAULT]CHARACTERSET<字符集名>|[DEFAULT]COLLATE<校对规则名>}语法说明如下:ALTERDATABASE用于更改数据库的全局特性。使用AL......
  • 【一周聚焦】联邦学习 10.9-10.16
    近期的联邦学习做了如下内容:大模型目前大模型是绝对的研究风口,而FL中为了降低传输开销的网络压缩技术也是可以服务于LLM的高效传输的。港科大+微众银行,10月16,FATE-LLM:AIndustrialGradeFederatedLearningFrameworkforLargeLanguageModels杨强团队一直在推FATE这个联......
  • 10.16
    编写一个方法,使用以上算法生成指定数目(比如1000个)的随机整数。源代码:importjava.util.Scanner;importjava.util.Random;publicclassMain{publicstaticvoidmain(String[]args){Scannersin=newScanner(System.in);System.out.println("请输入想......
  • 大二快乐日记10.16
    2.配置多个<url-pattern>子元素从Servlet2.5开始,<servlet-mapping>元素可以包含多个<url-pattern>子元素,每个<url-pattern>代表一个虚拟路径的映射规则。因此,通过在一个<servlet-mapping>元素中配置多个<url-pattern>子元素,也可以实现Servlet的多重映射。以ser......