周四今天没课做一下作业
一. 单选题(共10题,20分)
1. (单选题, 2分)第三次信息化浪潮的标志是:
- A. 个人电脑的普及
- B. 虚拟现实技术的普及
- C. 云计算、大数据、物联网技术的普及
- D. 互联网的普及
2. (单选题, 2分)分布式文件系统指的是什么?
- A. 把文件分布存储到多个计算机节点上,成千上万的计算机节点构成计算机集群
- B. 用于在Hadoop与传统数据库之间进行数据传递
- C. 一个高可用的,高可靠的,分布式的海量日志采集、聚合和传输的系统
- D. 一种高吞吐量的分布式发布订阅消息系统,可以处理消费者规模的网站中的所有动作流数据
3. (单选题, 2分)下面哪一项不属于计算机集群中的节点?
- A. 主节点(Master Node)
- B. 从节点(Slave Node)
- C. 源节点(SourceNode)
- D. 名称结点(NameNode)
4. (单选题, 2分)下列哪一项不属于HDFS采用抽象的块概念带来的好处?
- A. 简化系统设计
- B. 支持大规模文件存储
- C. 强大的跨平台兼容性
- D. 适合数据备份
5. (单选题, 2分)在HDFS中,NameNode的主要功能是什么?
- A. 维护了block id 到datanode本地文件的映射关系
- B. 存储文件内容
- C. 文件内存保存在磁盘中
- D. 存储元数据
6. (单选题, 2分)下面对FsImage的描述,哪个是错误的?
- A. FsImage用于维护文件系统树以及文件树中所有的文件和文件夹的元数据
- B. FsImage文件包含文件系统中所有目录和文件inode的序列化形式
- C. FsImage文件记录了每个块具体被存储在哪个数据节点
- D. FsImage文件没有记录每个块存储在哪个数据节点
7. (单选题, 2分)下面对SecondaryNameNode第二名称节点的描述,哪个是错误的?
- A. SecondaryNameNode通过HTTPGET方式从NameNode上获取到FsImage和EditLog文件,并下载到本地的相应目录下
- B. 它是用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
- C. SecondaryNameNode一般是并行运行在多台机器上
- D. SecondaryNameNode是HDFS架构中的一个组成部分
8. (单选题, 2分)HDFS采用了什么模型?
- A. 分层模型
- B. 主从结构模型
- C. 管道-过滤器模型
- D. 点对点模型
9. (单选题, 2分)在Hadoop项目结构中,HDFS指的是什么?
- A. Hadoop上的数据仓库
- B. 资源管理和调度器
- C. 流数据读写
- D. 分布式文件系统
10. (单选题, 2分)下列关于HDFS的描述,哪个不正确?
- A. HDFS采用块的概念,使得系统的设计变得更加复杂
- B. HDFS采用了主从(Master/Slave)结构模型
- C. HDFS采用了冗余数据存储,增强了数据可靠性
- D. HDFS还采用了相应的数据存放、数据读取和数据复制策略,来提升系统整体读写响应性能
二. 多选题(共14题,28分)
11. (多选题, 2分)信息科技为大数据时代提供哪些技术支撑?
- A. 存储设备容量不断增加
- B. 网络带宽不断增加
- C. CPU 处理能力大幅提升
- D. 数据量不断增大
12. (多选题, 2分)大数据具有哪些特点?
- A. 数据的“大量化”
- B. 数据的“快速化”
- C. 数据的“多样化”
- D. 数据的“价值密度比较低”
13. (多选题, 2分)大数据的两个核心技术是什么?
- A. 分布式存储
- B. 分布式应用
- C. 分布式处理
- D. 集中式存储
14. (多选题, 2分)HDFS要实现以下哪几个目标?
- A. 复杂的文件模型
- B. 兼容廉价的硬件设备
- C. 大数据集
- D. 流数据读写
15. (多选题, 2分)HDFS特殊的设计,在实现优良特性的同时,也使得自身具有一些应用局限性,主要包括以下哪几个方面?
- A. 无法高效存储大量小文件
- B. 较差的跨平台兼容性
- C. 不支持多用户写入及任意修改文件
- D. 不适合低延迟数据访问
16. (多选题, 2分)HDFS采用抽象的块概念可以带来以下哪几个明显的好处?
- A. 支持大规模文件存储
- B. 适合数据备份
- C. 支持小规模文件存储
- D. 简化系统设计
17. (多选题, 2分)在HDFS中,名称节点(NameNode)主要保存了哪些核心的数据结构?
- A. DN8
- B. Block
- C. FsImage
- D. EditLog
18. (多选题, 2分)数据节点(DataNode)的主要功能包括哪些?
- A. 负责数据的存储和读取
- B. 根据客户端或者是名称节点的调度来进行数据的存储和检索
- C. 向名称节点定期发送自己所存储的块的列表
- D. 用来保存名称节点中对HDFS元数据信息的备份,并减少名称节点重启的时间
19. (多选题, 2分)HDFS的命名空间包含什么?
- A. 文件
- B. 块
- C. 磁盘
- D. 目录
20. (多选题, 2分)下列对于客服端的描述,哪些是正确的?
- A. 客户端是用户操作HDFS最常用的方式,HDFS在部署时都提供了客户端
- B. HDFS客户端是一个库,暴露了HDFS文件系统接口
- C. 严格来说,客户端并不算是HDFS的一部分
- D. 客户端可以支持打开、读取、写入等常见的操作
21. (多选题, 2分)HDFS只设置唯一一个名称节点,这样做虽然大大简化了系统设计,但也带来了哪些明显的局限性?
- A. 命名空间的限制
- B. 性能的瓶颈
- C. 隔离问题
- D. 集群的可用性
22. (多选题, 2分)HDFS数据块多副本存储具备以下哪些优点?
- A. 加快数据传输速度
- B. 适合多平台上运行
- C. 容易检查数据错误
- D. 保证数据可靠性
23. (多选题, 2分)HDFS具有较高的容错性,设计了哪些相应的机制检测数据错误和进行自动恢复?
- A. 数据节点出错
- B. 数据出错
- C. 名称节点出错
- D. 数据源太大
24. (多选题, 2分)数据产生方式大致经历了三个阶段,包括:
- A. 移动互联网数据阶段
- B. 运营式系统阶段
- C. 感知式系统阶段
- D. 用户原创内容阶段