web-dev-qa-db-ja.com

割合データをグラフ化する最良の方法は何ですか?

次のデータがあるとします。

     Category  positive   neutral  negative  total
0  Category 1  1.000000  0.000000       0.0      2
1  Category 2  1.000000  0.000000       0.0      1
2  Category 3  0.222222  0.277778       0.5     18

データは、各カテゴリのポジティブ/ニュートラル/ネガティブ(価数)の割合を表しており、2つの情報をグラフで伝えたいと思います。

  1. ポジティブ+ニュートラル+ネガティブが各カテゴリの100%を占める
  2. カテゴリが主にポジティブ/ニュートラル/ネガティブとそれらの相対的比率で構成されているかどうか

積み上げ棒グラフ

私が最初に試したのは、積み上げ棒グラフです。

enter image description here

積み上げ棒グラフでは、値が何を表しているのか明確ではありません。たとえば、カテゴリ3の否定的なグループはどのように解釈されるべきですか?バーの垂直方向の高さの半分しかカバーしていないため、50%ですか?それとも実際には100%ですか、それだけでポジティブでニュートラルが下半分をカバーしていますか?

また、スタッキングの関係で価数比は不明だと思います。たとえば、カテゴリ3のどの割合が中立ですか。ベースラインが上昇し、0ではなくなったため、不明確です。

グループ化された棒グラフ

次に、グループ化された棒グラフを試しました。

enter image description here

これでベースラインの問題が解決され、各カテゴリ内の相対的な比率を簡単に比較できると思いますが、2つの新しい問題が発生します。

  1. 単一の価数のみが表されるカテゴリー(例えば、カテゴリー1と2)はバーが1つしかないため、不均衡なグラフが作成されます。これにより、これらのバーが100%であることがわかるまで、ユーザーを一時的に混乱させる可能性があります。
  2. カテゴリー3の場合、プラス+ニュートラル+マイナスがそのグループ内のデータの100%を占めることはもはや明確ではありません。

パーセンテージの代わりにrawカウント値を使用してグループ化された棒グラフも簡単に検討しましたが、これは問題があります。これは、カテゴリ全体の合計が非常に不均衡であるため(たとえば、18と1)、私が主に関心を持っているのは価数分布です within 各カテゴリ(つまり、カテゴリ3には否定よりも肯定があるか?)

このタイプのデータを伝達する最も効果的な方法は何ですか?これは、円グラフが推奨されるまれなケースの1つですか?

2
Simon

ここでは、棒グラフまたは縦棒グラフが最適なオプションです。値が隣接している場合、値を簡単に比較できます。 「不均衡グラフの作成」で述べた問題を回避するために、値が明白になるようにラベルを追加できます。

Bar chart

または、少しだけ表示されるように最小値を設定することもできます。

Bar chart with nubs

合計が100%であることがもはや明確ではない2番目の問題に対処するために、パーセンテージ単位を表示できます。読者は、パターンから合計が100%であると想定します。適切なタイトルを付けると、「_____の割合の分割」にも役立ちます。 Percentage units

2
mrchaarlie

これが役に立てば幸いですが、あまり頭痛なく実装できるソフトウェアがあるかどうか疑問に思います

enter image description here

1
UX Labs

グラフィックスに表示したいものと正確に一致していないコンテキストがあると思うので、完全な答えではありません(グラフのタイプではなく、最初に検討する必要があると思われます)。感情分析の表示に使用される視覚化。

関係する一部の詳細に入る リサーチペーパー がありますが、すべての詳細を経由せずに、このスペースでサービスプロバイダーのいくつかを調べると、いくつかの例を見ることができます。 :

  • IBMワトソン
  • Lexer.io
  • Falcon.io
  • 送信可能
  • ほおつて
  • iSentia

さらに、感情分析情報を表示する方法のいくつかのバリエーションを確認できます。特定のソーシャルメディアチャネルのみに焦点を当てている場合、これを提示する方法は、異なるソーシャルメディアチャネルを組み合わせる場合とは異なる場合があることに注意してください。

0
Michael Lai

全体が構成要素にどのように分割されているかを示すグラフが必要です。一般的な慣習では、円グラフで考えるように指示される場合があります。

例として、次の3つのカテゴリの円グラフは、3つのタイプのデータを示しています。

Pie chart Data Info

グラフから、パイのほぼ半分がニュートラルであることは明らかです。また、ネガティブは4分の1以上を表し、ニュートラルのシェアとほぼ等しいと言うこともできます。しかし、ニュートラルとネガティブの違いが互いに大きいか小さいかを判断するのに苦労するかもしれません。鋭角および鈍角を正確に推定するよりも、直線と直角を見つける方がはるかに優れています(たとえば、はじめに here を参照してください)。

円グラフは当然のことながら部分から全体の感覚を与えてくれますが、その中にエンコードされたほとんどのデータをデコードするために必要な知覚的なタスクはあまり得意ではありません。研究では、円グラフを研究するときのように角度や面積を判断するよりも、棒グラフを読むときの典型的な視覚的作業である、位置合わせされたスケールに沿った長さと位置の知覚に優れていることを示しています。

もちろん、グラフには適切なラベルを付ける必要があるので、それらを追加できます。ラベルを読み取ることができるため、円グラフから相対的な違いが明らかになります。しかし、それは視覚的な推論ではなく言葉による推論を使用しています。テーブルから数値を読み取ることもできますが、テーブルには位置合わせの利点があります。そして、値を説明する簡単な文–たとえば、「パイの44%は中立、39%は否定的、17%は肯定的です。」 –占有するスペースがはるかに少なくなります。

これは SpenceとLewandowskyによる調査 と一致しており、棒グラフの棒よりも円グラフのセクターの合計の組み合わせの判断が得意であることを示しています。その調査を額面どおりに行うことは、自問するべき明白な質問につながります–チャートの目的は、意図したユーザーがコンポーネントの任意の組み合わせとコンポーネントの他の任意の組み合わせを比較できるようにすることですか?もしそうなら、円グラフが妥当な選択かもしれません(特に、データが25%または50%の合計シェアを生み出す場合)。

最後に、円グラフに代わる人気のあるものはドーナツグラフで、円の中心が削除され、(頻繁に)テキストに置き換えられています。

0
Mehul Shah