web-dev-qa-db-ja.com

Amazon S3 SelectとAmazon Redshift Spectrumの違い

Amazon Redshift Spectrumを使用すると、Amazon S3に保存されているデータに対して直接クエリを実行できます。これも新しいAmazon S3 Selectサービスの目的のようです。これら2つのサービスの主な違いは何ですか?なぜどちらを選ぶべきなのですか?

4
Ryan Hilbert

S3 Selectは、SQLを使用してS3からデータを取得することに重点を置いています。

S3 Select。アプリケーションは、単純なSQL式を使用して、オブジェクトからデータのサブセットのみを取得できます。 S3 Selectを使用してアプリケーションで必要なデータのみを取得することで、パフォーマンスを大幅に向上させることができます。多くの場合、従来のS3の取得と比較して400%も向上します。

Redshift Spectrumは、AWS RedshiftクラスターからS3データを直接クエリできるようにします。

Amazon Redshift Spectrumを使用すると、Amazon S3のエクサバイトのデータに対してAmazon Redshift SQLクエリを実行できます。 Redshift Spectrumを使用すると、Amazon Redshiftの分析力を拡張して、データウェアハウスのローカルディスクに保存されているデータを超えて、Amazon S3の「データレイク」にある大量の非構造化データをクエリできます。

AthenaはS3からのデータの抽出、変換、読み込み(ETL)に重点を置いており、AWS Glueとの良好な統合を備えています。

アテナは使いやすいです。 Amazon S3でデータをポイントし、スキーマを定義して、標準SQLを使用してクエリを開始するだけです。ほとんどの結果は数秒以内に配信されます。 Athenaを使用すると、分析用にデータを準備するために複雑なETLジョブを実行する必要がありません。これにより、SQLのスキルを持つ誰でも簡単に大規模なデータセットを分析できます。

参照: AthenaSpectrum および S3 Select

7
Lucas Carvalho