1. (多选题) Apache软件基金会最重要的三大分布式计算系统开源项目
A Storm B SparkC Hadoop
D Hive
2. (多选题) Spark最主要的优点是()
A Spark提供了内存计算 B 提供了单一数据集操作类型 C 计算模式只能是MapReduce D 基于DAG的任务调度执行机制3. (多选题) Spark具有的主要特点包括:
A 运行模式多样 B 通用性 C 容易使用 D 运行速度快4. (多选题) Spark所采用Executor的优点包括:
A 利用多线程来执行具体的任务 B 多线程之间的数据共享C Executor中有一个BlockManager存储模块,有效减少IO开销
D 存储模块全部都只能在内存中完成5. (多选题) Scala的特性包括:
A 运行速度快 B Scala具备强大的并发性 C Scala语法复杂 D Scala兼容Java二. 单选题(共1题,14.3分)
6. (单选题) 在实际应用中,大数据处理不包括哪些类型?
A 基于历史数据的交互式查询 B 基于实时数据流的数据处理 C 复杂的批量数据处理 D 基于离线数据的处理标签:总结,20231025,Scala,多选题,学习,数据处理,单选题,Spark,多线程 From: https://www.cnblogs.com/xxaxf/p/17788407.html