私は頭をOLAPに巻き込もうとしている初心者ですが、いくつか質問があります。
当社のIT部門は、特定のMS Analsis Services ROLAPキューブで発生している問題の種類に関するフィードバックを求めています。その背後にあるリレーショナルデータベースへのアクセス権がないため、現在キューブ内のメジャーとして使用できない計算を実行する必要があります。
私にこの権利があるかどうか見てみましょう。
私はリーランドウィルキンソンのThe Grammar of Graphicsを読んでおり、データマイニングとOLAPに関する彼の章で、
これらの[キューブ操作]は、カウント、平均、比率、標準偏差などの統計でうまく機能します。サブクラスの単純な集計は、合計、二乗和、および線形関数で組み合わせて基本的な要約統計量を生成する他の項を操作することで計算できます。
これらの統計の集計はそれらの集計の統計ではないため、中央値、モード、パーセンタイルなどの統計では正しく機能しません。たとえば、中央値の中央値は、集計の中央値ではありません。
彼はさらに続けます:
しかし、最近、より洗練されたROLAPモデルが登場しました。いくつかのテクノロジーを通じて、統計アルゴリズムがリレーショナルモデルを通じて生データにリアルタイムでアクセスできるようにすることが可能です。このアプローチは、データキューブなどの構造によって提供される固定集計よりも有望です。
このアーキテクチャの最もエレガントな形式では、アプリケーションはリモート接続を要求して、データ処理方法に関する情報を提供し、返された情報に応じて適切なアクションを実行できます。この形式では、コンポーネントアーキテクチャは、分散コンピューティングの真の期待、つまりサイト、オペレーティングシステム、または言語に依存しない設計と実行を実現できます。
それは2005年頃に書かれました。行レベルのデータアクセスを可能にするためにこの方法論を採用している製品を知っている人はいますか?
質問に順番に答えるには:
キューブスクリプトで直接使用できない計算を実行する場合は、多くのOLAP遅れて嘆かれるProClarityなどのツールを使用して、カスタムMDXベースの計算を含むクエリを作成できます。キューブには、実際の計算に必要な情報がありません。カスタムMDX計算は、必要な計算をサポートできる必要があります。
OLAPクエリは伝統的に統計クエリに集約的に関連付けられていますが、詳細にドリルダウンできるディメンションがある場合、中央値、百分位数、またはヒストグラムクエリを計算するクエリを公式化することは確かに可能です。どのモードから推測または計算できるか。
たとえば、これは、ランキングに基づく パレート分析 クエリの例です。
多くのキューブ製品は、ハイブリッドモードまたはリレーショナルモードで動作できます。OLAPモードでは、データ自体は保持されませんが、基になるデータベースからデータをクエリします。さらに、Business Objects、Report Builderなどの純粋なROLAPツールまたはDiscovererは、基礎となるデータベースからクエリを実行し、行ごとに作業を行うことができます。ただし、専用のOLAP製品の洗練度に欠ける傾向があり、統計分析の方法があまりありません。すぐに使える機能。