データベースとデータウェアハウスの違いは何ですか?
それらは同じものではありませんか、少なくとも同じもので書かれていますか(つまり、Oracle RDBMS)?
詳細については、 this をご覧ください。
前のリンクから:
データベース
データウェアハウス
データウェアハウスは、ゼロから多数のデータベースに供給できることに注意することも重要です。
非技術的観点から:データベースは特定のアプリケーションまたはアプリケーションのセットに制限されます。
データウェアハウスは、エンタープライズレベルのデータリポジトリです。これには、ビジネスのすべて/多くのセグメントからのデータが含まれます。この情報を共有して、ビジネスの全体像を提供します。また、ビジネスのさまざまなセグメントを統合することも重要です。
技術的な観点から:「データウェアハウス」という言葉には、認識されている定義はありません。個人的には、データウェアハウスをデータマートのコレクションとして定義しています。各データマートが1つ以上のデータベースで構成され、データベースが特定の問題セット(アプリケーション、データセット、またはプロセス)に固有である場合。
単純にデータベースを置くことは、データウェアハウスのコンポーネントです。この概念を探求する多くの場所がありますが、「定義」がないため、あなたが答えるどんな課題にも挑戦するでしょう。
データウェアハウスは、データベースの一種です。
人々がすでに言ったことに加えて、データウェアハウスはOLAPである傾向があり、インデックスなどは書き込みではなく読み取り用に調整されており、データは非正規化/読みやすく分析しやすい形式に変換されます。
一部の人々は、「データベース」はOLTPと同じであると言っていますが、これは正しくありません。ここでも、OLTPはデータベースの一種です。
他の種類の「データベース」:テキストファイル、XML、Excel、CSV ...、フラットファイル:-)
それを説明する最も簡単な方法は、データウェアハウスが単なるデータベース以上のもので構成されていると言うことです。データベースは何らかの方法で編成されたデータのコレクションですが、データウェアハウスは「レポートと分析を促進する」ために特別に編成されています。ただし、データウェアハウジングには「データを取得および分析し、データを抽出、変換、ロードし、データディクショナリを管理する手段もデータウェアハウジングシステムの必須コンポーネントである」と記載されているため、これだけではありません。
データベース:-OLTP(オンライントランザクションプロセス)
データウェアハウス
データウェアハウスとデータベース:データウェアハウスは、データ分析のために特別に設計されており、大量のデータを読み取ってデータ全体の関係と傾向を把握する必要があります。データベースは、トランザクションの詳細の記録などのデータをキャプチャおよび保存するために使用されます。
データウェアハウス:適切なワークロード-分析、レポート、ビッグデータ。 データソース-多くのソースから収集および正規化されたデータ。 データキャプチャ-事前に決められたバッチスケジュールでの一括書き込み操作。 データの正規化-スタースキーマやスノーフレークスキーマなどの非正規化スキーマ。 データストレージ-アクセスの簡素化と高速クエリのために最適化されています。円柱ストレージを使用したパフォーマンス。 データアクセス-I/Oを最小化し、データスループットを最大化するように最適化されています。
トランザクションデータベース:適切なワークロード-トランザクション処理。 データソース-トランザクションシステムなど、単一のソースからそのままキャプチャされたデータ。 データキャプチャ-トランザクションスループットを最大化するために新しいデータが利用可能なため、連続書き込み操作用に最適化データの正規化-高度に正規化された静的スキーマ。 データストレージ-単一の行指向の物理ブロックへの書き込み操作全体にわたって高に最適化されています。 データアクセス-大量の小さな読み取り操作。
通常、アプリケーションのデータストレージはすべてデータベースを使用します。リレーショナルデータベースの場合もあれば、現在流行しているSQLデータベースがない場合もあります。
データウェアハウスもデータベースです。データウェアハウスデータベースは、企業の分析レポート目的の専用データストレージとして呼び出すことができます。このデータは、主要なビジネス決定に使用されます。
整理されたデータは、ビジネス上の意思決定を効果的に報告および実行するのに役立ちます。
データベースは、現在のレコードを保持するなどのオンライントランザクションプロセスに使用されるため、データベースのクラスターにすることができます。しかし、データウェアハウスでは、オンライン分析プロセスのための履歴データを保存します。
例:家は$100,000
の価値があり、年に$1000
で高く評価されています。
現在の家の値を追跡するには、値が毎年変化するため、データベースを使用します。
3年後、あなたは$103,000.
である家の価値を見ることができるでしょう
過去の家の価値を追跡するには、家の価値がそうであるようにデータウェアハウスを使用します
$100,000 on year 0,
$101,000 on year 1,
$102,000 on year 2,
$103,000 on year 3.
データウェアハウスは、通常データベースに格納されるデータ構造の一種です。データウェアハウスは、データモデルとそこに保存されているデータの種類を参照します。モデル化されたデータ(データモデル)は分析目的に使用されます。
データベースは、データを格納する構造として分類できます。従来は、Oracle、SQL Server、MySQLなどのRDBMSでした。ただし、データベースは、Apache CassandraのようなNoSQLデータベース、またはAWS RedShiftのような円柱MPPにすることもできます。
データベースは単にデータを保存する場所です。データウェアハウスは、データを格納する特定の方法であり、分析クエリを提供するという特定の目的を果たします。
OLTPとOLAPは、DWとデータベースの違いを示していません。OLTPとOLAPの両方がデータベースに存在します。異なる方法(異なるデータモデル方法論)でデータを保存し、異なる目的(OLTP-トランザクションを記録、更新用に最適化、OLAP-情報を分析、読み取り用に最適化)を行うだけです。