首页 > 编程语言 >《Spark编程基础》(Scala版)第八章简答题答案(自制)

《Spark编程基础》(Scala版)第八章简答题答案(自制)

时间:2024-05-16 21:55:05浏览次数:21  
标签:机器 Scala 简答题 DataFrame 学习 API 流水线 Spark

8 Spark MLlib

简答题

T1 与 MapReduce 框架相比,为何 Spark 更适合进行机器学习各算法的处理?

答:通常情况下,机器学习算法参数学习的过程都是迭代计算。MapReduce 由于延迟高、磁盘开销大、无法高效支持迭代计算,不适合高效的实现机器学习算法;Spark 由于立足于内存计算,所以能很好地与机器学习算法相匹配。

T2 简述流水线(Pipeline)几个部件及主要作用,使用 Pipeline 来构建机器学习工作流有什么好处?

标签:机器,Scala,简答题,DataFrame,学习,API,流水线,Spark
From: https://www.cnblogs.com/hanihou/p/18196808

相关文章