作為大數據處理的主流框架之一,spark在近幾年的發展趨勢無疑是很好的。Spark繼承了第一代計算框架Hadoop MapReduce的優勢,專注於計算性能優勢的提升,大大提升了大規模數據處理的效率。
Spark是針對超大數據集合的處理而涉及的,基於分佈式集羣,實現準實時的低延遲數據處理。理論上來時,Spark的計算速度比Hadoop提升了10-100倍。