Azure Data Lake AnalyticsとAzure Databricksはどちらもバッチ処理に使用できます。誰がいつ他のものを選ぶべきか理解するのを助けてくれませんか?
私の謙虚な意見では、その多くは既存のスキルセットに帰着します。 Spark、Java、Python、rまたはScalaの経験があるチームがいる場合、Databricksは自然なフィットです。一方、既存のSQLおよびc#スキルを持つチームがある場合U-SQLを使用した学習曲線はそれほど急ではありません。
それとは別に、違いを引き起こすことができる他の質問があります:
UPDATE 2018年10月:私の知る限り、U-SQLは現時点ではADLS Gen 2をサポートしていません。 )。投稿ifとそのサポートが追加されたときに更新します。
2019年1月の更新:U-SQLには、 Spring 2018 以降、意味のある更新がありません。
HTH
Databricksには、さまざまなスキルを持つ専門家がデータを操作できる言語オプションがあります。また、データブリックを使用すると、高性能のメモリ内クラスターでジョブを実行できます。
プロジェクトでは、データレイクをストレージとして使用し、databricksノートブックを介してすべてのジョブ(ETL、分析)を実行します。データレイクにデータを保存する方が安くなります。
複雑なバッチジョブやさまざまな種類の専門家があなたのデータに取り組む場合、質問に戻ります。 Azure Data Lake + Databricksアーキテクチャを選択できます。そうでなければ、Azure Data Lakeがニーズを満たします。
これらの2つの記事をご覧ください。 https://databricks.com/glossary/data-lakehttps://visualbi.com/blogs/Microsoft/Azure/etl-Azure-databricks-vs-data-lake- analytics /