最近Azure 発表済み Data Lake Gen 2プレビュー。私の知る限り、Gen 1とGen 2の主な違い(機能面)は、オブジェクトストアとファイルシステムが同じデータを同時にアクセスすることです。他の違いは価格、利用可能な場所などです。Gen1とGen 2のその他の重要な違いは何か説明できますか?
基本的に、gen2をgen1のスーパーセットに加えて、BLOBストレージのすべての最良の部分である階層、HDFS、オブジェクトストアAPI、およびおそらく35Kを超えるファイルの管理を効率的に処理し、多くの小さなサイズや細流を効率的に処理する機能と考えてくださいタイプ操作の書き込み..さらに安い.
私はいくつかの詳細をある程度明確にしようとしていますが、その間に多くを見つけられませんでした:
https://Azure.Microsoft.com/en-us/blog/a-closer-look-at-Azure-data-lake-storage-gen2/
https://docs.Microsoft.com/en-us/Azure/storage/data-lake-storage/introduction
AzureデータレイクストレージGen2は、AzureデータレイクGen 1のスーパーセットです。Microsoftによって「妥協のないデータレイク」とも呼ばれています。 Gen 2はAzure BLOBストレージ機能を拡張し、分析ワークロード向けに最適化されています。アトミックファイルおよびフォルダー操作をサポートするため、データベース操作を行うときにプログラミング変更やデータコピーなしで、データを一度保存し、既存のBLOBストレージおよびHDFS準拠のファイルシステムインターフェイスを介してアクセスできます。
現在、米国西部2および米国中西部のデータセンターでのみ利用可能です。しかし、マイクロソフトによると、近い将来、他のデータセンターに拡張される予定です。