GoogleBigQueryとAmazonRedshiftを比較すると、どちらも同じ一連の要件に対応でき、主にコストプランが異なります。 Redshiftは、テーブルの結合に問題がある可能性があるGoogle BigQueryと比較して、構成(キーの定義と最適化作業)がより複雑であるようです。
GoogleBigQueryとAmazonRedshiftの長所と短所のリストはありますか?
この比較をredditに投稿しました。すぐに、RedShiftの長期開業医が私の発言にコメントするようになりました。完全な会話については、 https://www.reddit.com/r/bigdata/comments/3jnam1/whats_your_preference_for_running_jobs_in_the_aws/cur518e を参照してください。
クラスターのサイズ設定:
何もしない場合の1時間あたりのコスト:
クエリの速度:
インデックス作成:
掃除機:
データの分割と配布:
ライブデータのストリーミング:
クラスターの成長:
マルチゾーン:
BigQueryを試すために、クレジットカードやセットアップ時間は必要ありません。試してみてください( BigQueryを試すための簡単な手順 )。
独自のデータをBigQueryに配置する準備ができたら、JSONの改行で区切られたログをGoogle CloudStorageにコピーしてインポートするだけです。
クラウドでのデータウェアハウスの価格設定に関する詳細なガイドは次のとおりです。 クラウドの価格設定パート3.2について-その他のデータウェアハウス
Amazon Redshiftは、拡張を可能にするMPP機能を備えた標準のSQLデータベース(Postgresに基づく)です。これらの機能では、最高のパフォーマンスを得るには、データモデルをある程度適合させる必要もあります。大量のSQL標準をサポートしており、Postgresと通信できるほとんどのツールは変更せずに使用できます。
BigQueryはデータベースではありません 標準SQLを使用せず、JDBC/ODBC接続を提供しないという意味で 。独自のAPIとインターフェースを備えたユニークなサービスです。 SQLクエリのサポートは制限されていますが、ほとんどのユーザーはカスタムコード(Java、Pythonなど)を介して対話します。一部のサードパーティツールはBigQueryのサポートを追加していますが、既存のツールは変更しないと機能しません。
tl; dr-Redshiftは、既存のツールとの対話や複雑なSQLの使用に適しています。 BigQueryは、カスタムコード化されたインタラクションやSQLを嫌うチームに適しています。
更新2017-04-17-コストと速度の違いの最新の要約があります(売り込みに包まれているのでYMMV)。 TL; DR-Redshiftは通常高速であり、データをある程度定期的にクエリすると安価になります。 http://blog.panoply.io/a-full-comparison-of-redshift-and-bigquery
UPDATE-私はこれに反対票を投じ続けているので(???? ♂️)、他の回答の項目に対する最新の回答があります:
クラスターのサイズ設定:
何もしない場合の1時間あたりのコスト:
クエリの速度:
インデックス作成:
掃除機:
データの分割と配布:
ライブデータのストリーミング:
クラスターの成長:
マルチゾーン: