web-dev-qa-db-ja.com

列ストアデータベースが新しいものになったのはなぜですか?

列ストアデータベースには、従来のデータベースに比べていくつかの利点があります。特に、圧縮と高速シークです。列ストアは、過去数年間のデータベースの新しい流行のようであり、HANAが最も明白な例ですが、MicrosoftとOracle(およびその他)がそれに続いています。

ただし、列ストアデータベースの考え方は新しいものではありません。

TAXIRは、列指向データベースストレージシステムの最初のアプリケーションでした... 1969年

ウィキペディア

列データベースが普及するのに過去8年までかかったのはなぜですか?確かに、データベースの圧縮は、ハードドライブのストレージが現在ほど安価ではなかった1970年代に非常に役立ちました(そして、より高速なシークは決して痛いものではありませんでした)。列ストアデータベースを有効にした過去10年間の別の開発はありますか?

1
Jonny

概して、データウェアハウジングの人気の高まりは、列ストアインデックスへの移行を促していると思います。

列ストアインデックスは、通常はデータウェアハウスのファクトテーブルにある大量のデータを含むワークロードのクエリパフォーマンスを向上させることを目的としています。

列ストアインデックスは、行ではなく列ごとにデータを格納します。データを行ではなく列に格納することにより、データベースは、行の不要なデータをスキャンして破棄するのではなく、クエリに回答するために必要なデータに正確にアクセスできます。

データウェアハウスで一般的に見られるような幅の広いテーブルの場合、特定のクエリでアクセスする必要のあるデータの量とサイズを本質的に削減できるため、列ストアインデックスが役立ちます。

詳細と例については、次のリンクのいくつかを確認してください。

SQL Server列ストアインデックスについて

列指向DBMS

SQL Server 2012の列ストアインデックス

2
Scott Hodgin

「列ストアデータベースには従来のデータベースに比べていくつかの利点がある」という当初の前提は、過度に一般的です。このステートメントは、特定のワークロード、具体的にはOLAP type 、ほとんどが読み取り専用で、集計またはウィンドウ関数が含まれます。

商用ユーザーや政府機関によって保存および処理されるデータの量が過去10年間で指数関数的に増加していることはよく知られています。また、列指向ストレージエンジン、特にビジネス分析や機械学習アプリケーションで好まれるワークロードの種類は、コラムストアのメリットはデメリットを上回り、近年人気が高まっています。

これらが、列編成データストアが最近(比較的)広く使用されるようになった理由です。

2
mustaccio