列ストアデータベースには、従来のデータベースに比べていくつかの利点があります。特に、圧縮と高速シークです。列ストアは、過去数年間のデータベースの新しい流行のようであり、HANAが最も明白な例ですが、MicrosoftとOracle(およびその他)がそれに続いています。
ただし、列ストアデータベースの考え方は新しいものではありません。
TAXIRは、列指向データベースストレージシステムの最初のアプリケーションでした... 1969年
( ウィキペディア )
列データベースが普及するのに過去8年までかかったのはなぜですか?確かに、データベースの圧縮は、ハードドライブのストレージが現在ほど安価ではなかった1970年代に非常に役立ちました(そして、より高速なシークは決して痛いものではありませんでした)。列ストアデータベースを有効にした過去10年間の別の開発はありますか?
概して、データウェアハウジングの人気の高まりは、列ストアインデックスへの移行を促していると思います。
列ストアインデックスは、通常はデータウェアハウスのファクトテーブルにある大量のデータを含むワークロードのクエリパフォーマンスを向上させることを目的としています。
列ストアインデックスは、行ではなく列ごとにデータを格納します。データを行ではなく列に格納することにより、データベースは、行の不要なデータをスキャンして破棄するのではなく、クエリに回答するために必要なデータに正確にアクセスできます。
データウェアハウスで一般的に見られるような幅の広いテーブルの場合、特定のクエリでアクセスする必要のあるデータの量とサイズを本質的に削減できるため、列ストアインデックスが役立ちます。
詳細と例については、次のリンクのいくつかを確認してください。
「列ストアデータベースには従来のデータベースに比べていくつかの利点がある」という当初の前提は、過度に一般的です。このステートメントは、特定のワークロード、具体的にはOLAP type 、ほとんどが読み取り専用で、集計またはウィンドウ関数が含まれます。
商用ユーザーや政府機関によって保存および処理されるデータの量が過去10年間で指数関数的に増加していることはよく知られています。また、列指向ストレージエンジン、特にビジネス分析や機械学習アプリケーションで好まれるワークロードの種類は、コラムストアのメリットはデメリットを上回り、近年人気が高まっています。
これらが、列編成データストアが最近(比較的)広く使用されるようになった理由です。