在spark中最重要的东西有一个超级重要的组件是:dag的调度器。上面的sql经过翻译之后,就变成了一个dag图,然后这个dag的调度器就开始对这个dag图中所代表的操作去做执行了。
图计算是计算机领域中非常重要的一种计算模型了。
计算机中基础的数据结构课中,有图计算相关的内容,有向无环图的最短路径的计算,disikela算法等等。
然后是各种云产品其实都支持用户采用拖拉式的方式去进行一个图计算方式的编辑;
还有社交网络中把这些人和人之间的关系构建出一个网络,然后在这个图中做各种各样的计算;
大数据中,的map-reduce计算模型中,将所有复杂的map reduce的操作也都是翻译成了一个有向无环dag图,然后每个阶段的计算都是在这个dag图重
标签:map,dag,reduce,调度,计算,spark From: https://www.cnblogs.com/honpey/p/18064745