次のデータがあるとします。
Category positive neutral negative total
0 Category 1 1.000000 0.000000 0.0 2
1 Category 2 1.000000 0.000000 0.0 1
2 Category 3 0.222222 0.277778 0.5 18
データは、各カテゴリのポジティブ/ニュートラル/ネガティブ(価数)の割合を表しており、2つの情報をグラフで伝えたいと思います。
積み上げ棒グラフ
私が最初に試したのは、積み上げ棒グラフです。
積み上げ棒グラフでは、値が何を表しているのか明確ではありません。たとえば、カテゴリ3の否定的なグループはどのように解釈されるべきですか?バーの垂直方向の高さの半分しかカバーしていないため、50%ですか?それとも実際には100%ですか、それだけでポジティブでニュートラルが下半分をカバーしていますか?
また、スタッキングの関係で価数比は不明だと思います。たとえば、カテゴリ3のどの割合が中立ですか。ベースラインが上昇し、0ではなくなったため、不明確です。
グループ化された棒グラフ
次に、グループ化された棒グラフを試しました。
これでベースラインの問題が解決され、各カテゴリ内の相対的な比率を簡単に比較できると思いますが、2つの新しい問題が発生します。
パーセンテージの代わりにrawカウント値を使用してグループ化された棒グラフも簡単に検討しましたが、これは問題があります。これは、カテゴリ全体の合計が非常に不均衡であるため(たとえば、18と1)、私が主に関心を持っているのは価数分布です within 各カテゴリ(つまり、カテゴリ3には否定よりも肯定があるか?)
このタイプのデータを伝達する最も効果的な方法は何ですか?これは、円グラフが推奨されるまれなケースの1つですか?
グラフィックスに表示したいものと正確に一致していないコンテキストがあると思うので、完全な答えではありません(グラフのタイプではなく、最初に検討する必要があると思われます)。感情分析の表示に使用される視覚化。
関係する一部の詳細に入る リサーチペーパー がありますが、すべての詳細を経由せずに、このスペースでサービスプロバイダーのいくつかを調べると、いくつかの例を見ることができます。 :
さらに、感情分析情報を表示する方法のいくつかのバリエーションを確認できます。特定のソーシャルメディアチャネルのみに焦点を当てている場合、これを提示する方法は、異なるソーシャルメディアチャネルを組み合わせる場合とは異なる場合があることに注意してください。
全体が構成要素にどのように分割されているかを示すグラフが必要です。一般的な慣習では、円グラフで考えるように指示される場合があります。
例として、次の3つのカテゴリの円グラフは、3つのタイプのデータを示しています。
グラフから、パイのほぼ半分がニュートラルであることは明らかです。また、ネガティブは4分の1以上を表し、ニュートラルのシェアとほぼ等しいと言うこともできます。しかし、ニュートラルとネガティブの違いが互いに大きいか小さいかを判断するのに苦労するかもしれません。鋭角および鈍角を正確に推定するよりも、直線と直角を見つける方がはるかに優れています(たとえば、はじめに here を参照してください)。
円グラフは当然のことながら部分から全体の感覚を与えてくれますが、その中にエンコードされたほとんどのデータをデコードするために必要な知覚的なタスクはあまり得意ではありません。研究では、円グラフを研究するときのように角度や面積を判断するよりも、棒グラフを読むときの典型的な視覚的作業である、位置合わせされたスケールに沿った長さと位置の知覚に優れていることを示しています。
もちろん、グラフには適切なラベルを付ける必要があるので、それらを追加できます。ラベルを読み取ることができるため、円グラフから相対的な違いが明らかになります。しかし、それは視覚的な推論ではなく言葉による推論を使用しています。テーブルから数値を読み取ることもできますが、テーブルには位置合わせの利点があります。そして、値を説明する簡単な文–たとえば、「パイの44%は中立、39%は否定的、17%は肯定的です。」 –占有するスペースがはるかに少なくなります。
これは SpenceとLewandowskyによる調査 と一致しており、棒グラフの棒よりも円グラフのセクターの合計の組み合わせの判断が得意であることを示しています。その調査を額面どおりに行うことは、自問するべき明白な質問につながります–チャートの目的は、意図したユーザーがコンポーネントの任意の組み合わせとコンポーネントの他の任意の組み合わせを比較できるようにすることですか?もしそうなら、円グラフが妥当な選択かもしれません(特に、データが25%または50%の合計シェアを生み出す場合)。
最後に、円グラフに代わる人気のあるものはドーナツグラフで、円の中心が削除され、(頻繁に)テキストに置き換えられています。