Apache Spark2と比較してApache Spark2がもたらす改善点は何ですか?
Apache Spark 2.0.0 APIは1.Xとほぼ同じままでした。Spark 2.0.0にはAPIの重大な変更があります
Apache Spark 2.0.0は2.x行の最初のリリースです。主要な更新はAPIの使いやすさ、SQL 2003のサポート、パフォーマンスの向上、構造化されたストリーミング、R UDFのサポート、および運用の改善。
spark 2:の新機能
Sparkリリース2.0. を確認できます。ここでは、次の点の更新について説明しています。
一言で言えば、DAGとRDDであるため、アーキテクチャに関して大きな違いはありません。これは最も重要な部分です。
Spark 2.0ははるかに最適化されており、開発者の手にはるかに強力なDataSet Apiがあります。したがって、アーキテクチャは同じで、Spark 2.0は、多くの最適化を提供し、豊富なApiを備えています!
これらは、Apache Spark 2.0によって提供される主なものです。
詳細については、こちらをご覧ください: https://www.quora.com/What-are-special-features-and-advantages-of-Apache-Spark-2-0-over-earlier-versions