Spark 为什么比 MapReduce 快
Spark 为什么比 MapReduce 快?
Spark是基于内存计算,MapReduce是基于磁盘运算,所以速度快MapReduce在Shuffle时需要花费大量时间进行排序;Spark在Shuffle时则只有部分场景才需要排序。- MapReduce 的
Map Task和Reduce Task都是进程级别的,每次启动都需要重新申请资源,消耗了不必要的时间;而Spark Task则是基于线程模型的,Spark通过复用线程池中的线程来减少启动、关闭task所需要的开销。 Spark还拥有容错机制
参考链接