Apache Apex -は、オープンソースのエンタープライズグレードの統合ストリームおよびバッチ処理プラットフォームです。これは、IOTのGEPredixプラットフォームで使用されます。これら2つのプラットフォームの主な違いは何ですか?
質問
Sparkとの比較:Apache Sparkは実際にはバッチ処理です。Sparkストリーミング(下でsparkを使用) )次に、マイクロバッチ処理です。対照的に、Apache apexは真のストリーム処理です。ある意味で、着信レコードは処理のために次のレコードを待つ必要はありません。レコードは処理され、すぐに次のレベルの処理に送信されます。到着すると。
現在、ApacheApexとApacheSamoa、H2Oなどの機械学習ライブラリとの統合のサポートを追加する作業が進行中です。参照 https://issues.Apache.org/jira/browse/SAMOA-49
現在、Java、Scalaをサポートしています。
https://www.datatorrent.com/blog/blog-writing-Apache-apex-application-in-scala/ Pythonの場合、Jythonを使用して試すことができます。しかし、私はそれを自分で試したことがありません。だから、それについてはよくわかりません。
Sparkは、2つの異なる処理エンジンであることを考えると、お勧めできません。ただし、Apacheapexと機械学習ライブラリの統合は進行中です。
他に質問がある場合は、Apache apexユーザーのメーリングリストに投稿できる機能のリクエスト: https://mail-archives.Apache.org/mod_mbox/incubator-apex-users/