web-dev-qa-db-ja.com

Data Warehouse vs. OLAP Cube?

データウェアハウスとOLAPキューブの違いは何ですか?

彼らは同じことに対して異なるアプローチですか?

それらの1つは他と比較して非推奨ですか?

それらの1つにパフォーマンスの問題はありますか?

どんな説明も歓迎します

58
veljasije

データウェアハウスは、データの分析を容易にする設計を備えたデータベースです†(多くの場合、複数のソースからのデータを使用)。通常、ファクトテーブルとディメンションテーブルで構成され、多くの場合、集計テーブルです。

OLAPは、ピボット、スライス、ダイシング、ドリルなどのデータセットに対して実行できる操作のセットです。たとえば、Excelピボットテーブルを使用してOLAP操作を実行できます。

データウェアハウスを作成し、OLAPをまったく使用しないようにすることができます(レポートを実行するだけです)。

フラットファイルなど、データウェアハウス以外の何かに対してOLAP操作を実行することもできます。

OLAPサーバーは、たとえばキャッシュやクエリの書き換えなど、OLAP操作を容易にするサーバーソフトウェアの一種です。 OLAP操作は多くの場合 [〜#〜] mdx [〜#〜] で表され、OLAPサーバーはMDXをデータベースの通常のSQL。または、独自のバイナリファイル形式に対して機能する場合があります。

彼らは同じことに対して異なるアプローチですか?

いいえ、データウェアハウスはデータを分析しやすい形式で保存する場所であり、OLAPはデータを分析する方法です。

それらの1つは他と比較して非推奨ですか?

いいえ、データウェアハウスによりOLAPを使用したデータの分析が容易になり、OLAPによりデータウェアハウスの分析がより便利になるという点で、お互いを補完します。

それらの1つにパフォーマンスの問題はありますか?

はい。データウェアハウスは、大量のデータを格納するためのものであるため、クエリに時間がかかります。インデックス、キャッシュ、パーティショニングを使用し、一部のデータを事前に集計することにより、パフォーマンスを改善できます。

参照: https://dba.stackexchange.com/questions/45655/what-are-measures-and-dimensions-in-cubes

†トランザクションをより簡単/より統合するのではなく

84
Neil McGuigan

データウェアハウスは、レポートの実行、分析などを行うデータを保持します。

キューブは、定義されたディメンションにデータをグループ化することにより、このデータを整理します。複数の次元を持つことができます(Excelで超ピボットテーブルを考えてください)。

たとえば、データウェアハウスではすべての売り上げがありますが、複雑なSQLクエリの実行には時間がかかる場合があります。したがって、データウェアハウスから、データにインデックスを付けて事前計算するキューブを作成します。キューブでは、これらの事前計算されたディメンションをすべて持つことができます。月ごと、週ごと、セールスマンごと、クライアントごと、地理的地域ごと、製品の色ごとなどです。その後、OLAP (月、セールスマン、地域)、または(色、地域)、または(セールスマン、月)ごとの合計、平均、および最大売上を持つキューブすべてのデータが事前計算され、インデックス付けされているため、クエリは非常に高速です。

3
sthiy

彼らは同じことに対して異なるアプローチですか?

いいえ、データウェアハウスはデータを分析しやすい形式で保存する場所であり、OLAPはデータを分析する方法です。

いいえ、彼らは本当に同じことをします! OLAPはDWHよりも事前計算されています。OLAPはDWHの集計のようなものです

1
user3657020