web-dev-qa-db-ja.com

一種の3Dテーブル(3つの変数間の相関関係を示す)

テーブルを使用すると、2変数(たとえば、「従業員」と「時間」)がどのように相関しているかを簡単に確認できます。私にとって、このビューの主な利点は、2種類の質問に対する答えを簡単に見つけられることです。お気に入り:

  • 従業員Xが私たちのために働き始めてから何をしているのですか?
  • 今日、みんなは何をしていますか?

私の質問:変数(たとえば、「従業員」、「時間」、「プロジェクト」)に対して同じことを行う、同じように使いやすいビューを作成する方法はありますか?

9
Bobby Marinoff

計算的にも数学的にも複雑になる可能性がありますが、ヒートマップの概念はここで役立ちます。

ヒートマップのポイントは、実際に追加の軸を持つのではなく、色を使用することによって、2次元プロットに3番目の次元を追加することです。たとえば、X軸は「従業員」、Y軸は「プロジェクト」、時間はXY平面に沿った色で表すことができます。ある色は「より多くの時間」を意味し、別の色は「少しの時間」を意味します。

以下の架空の例では、特定の従業員が特定のプロジェクトに多くの時間を費やしており、密接に関連するプロジェクトに費やす時間が少なく、無関係なプロジェクトに時間を費やしていません。

enter image description here

追加の色を使用して、4番目または5番目の次元を追加できます。たとえば、青のすべての色相は「時間」を意味する可能性がありますが、赤のすべての色相は「リソース消費」を意味する可能性があります。これらの色を組み合わせると、紫色になります。紫の色合いは、時間とリソースを費やすことを意味します。私の意見では、複雑さ(開発者にとってもユーザーにとっても)は、次元が追加されるたびに劇的に増加する傾向があります。その主張を裏付ける公式の調査はありません。それは私自身の経験です。

10
user1884155

視覚化の組み合わせについて少し戻って投稿された同様の質問がありました( 組み合わせの最適な視覚化 を参照)。上記のヒートマップに加えて、似ていますが異なるいくつかの他の選択肢もあります。

等高線図

等高線図は、領域の境界を表示することを除いて、ヒートマップによく似ています。領域を色でプロットするかどうかによって、境界が表示されるかどうかに多少の違いがあります。このオプションの名前は、土地の輪郭を実際に示している地形図に由来しています。関連する3つのデータを表示する場合にも同様に機能します。

可変マーカー付きの標準散布図

このオプションは、標準の2D散布図を拡張したものです。データポイントの領域にドットを配置するだけでなく、マーカーに追加情報をエンコードします。使用できるものは次のとおりです。

  • 連続変数を表示する色
  • 連続変数を表示するためのサイズ(これに注意してください。特定のオブジェクトのサイズ間の定量的な関係を理解するのが難しい場合があります)
  • マーカー形状を使用して、離散変数またはカテゴリ変数をエンコードできます

複数の散布図

複数の変数のペア間の関係を表示する場合は、行列または複数の散布図のアプローチを使用することもできます。これは、変数の大きなグループのペア間の関係を見つけるのに適しています。

平行座標プロット

平行座標プロットは、表示する変数が3つ以上ある場合に適切に機能しますが、3つでも適切に機能します。その特徴は、他の視覚化のデータを選択するために使用できるフィルタリングと相互作用を可能にすることです。また、ライン全体で色やその他のデータをエンコードするように調整されています。表示できる変数の数を考慮すると、スペースが非常にコンパクトです。グループにならない限り、関係にとってはあまり役に立ちません。

3
Byron Wall