roads
列のあるage
テーブルがあります。約3000の道路記録があり、最大年齢は70歳です。
この情報を自動生成されたレポートで管理レベルの従業員にまとめたいと思います。
資産年齢を視覚化するための効果的な方法は何でしょうか?
私が試したこと:
一見、年齢は棒グラフで視覚化されることが多いようです。それを行うにはいくつかの方法があるようです:
私の訓練されていない目には、データ分析の目的には#1が良いようです。読者は、特に低いまたは高い異常値または年を見つけることができます。 これは私の目的には必要ないと思います。
目的は情報の概要を経営陣に効果的に伝えることです。そのため、私は#2に傾くかもしれません。
個々の年のバーは、年齢の範囲よりも適切な選択になります。これは、長距離の表現が、長年にわたる新しい道路建設の傾向などの細部を隠す可能性があるためです。
X軸に道路の年齢、Y軸に道路の数を示す棒グラフを描画します。 3つの道路が10年前のものである場合、X軸の10番目のマークに3単位の高さのバーがあるはずです。
マイケルライの回答に対するあなたのコメントに基づいて、年齢に基づいてデータポイントをグループ化することに価値があることを理解しています。そのグループ化は、色分けによって簡単に表すことができます。色分けすることで、各年の細部を保持しながら、さまざまな年齢層を簡単に区別できます。各グループの上に、その年齢層の道路の数を示すラベルを付けることができます。
サンプル画像を追加しました。チャートは縮尺どおりに描かれていませんが、私が提案した主な概念は次のとおりです。この例では、年齢グループと道路の年齢などの棒グラフを色分けして明確にする必要があります。お役に立てれば。
マイケルはいくつかの重要なポイントを持ち出しました。このチャートは現実的なデータでどのように見えるでしょうか。 70年前までの3000本の道路。この質問に答えるために、現実的なデータセットをシミュレートしました。長年の都市開発の進展により、年間の道路建設件数は増加していると思いました。つまり、古い道路よりも新しい道路の方が多い可能性があります。したがって、X軸に沿って全体的な下降傾向が見られるはずです。ただし、私の仮定が正しくない場合、70年の期間で上昇傾向またはほぼ横ばいの傾向が見られます。私の回答の最初のガイドラインに従うことで、70年以上に渡って広がる3,000本の道路を視覚化できることがわかります。
マイケルはまた、グループ全体ではなく、7(または20、または30)に曲がる道路のみを強調表示する必要があると指摘しました。それぞれの列を個別のカラーコードで強調表示できます。追加情報は、それぞれの列の上にある一連の吹き出し/吹き出しで伝えることができます。 X軸の目盛りも強調表示して、強調表示された各列で表される道路の年齢を明確に示す必要があります。全体として、グラフは以下の例のようになります。
この回答の両方のグラフは Inkscape で描画されています。 Inkscapeはプロトタイピングに適していますが、Inkscapeを使用すると、実際のデータを使用してプロダクションレディチャートを作成するのは簡単ではない場合があります。
ブラウザーでチャートをレンダリングする場合、 D3.js または C3.js を使用できます。
印刷品質の出力をレンダリングするには、 Matplotlib 、a Pythonプロットライブラリ)をお勧めします。Matplotlibを使用すると、高品質のベクトルチャートを作成できます。
道路との関係で年齢に特別な意味はありますか(たとえば、5年ごとに再舗装する必要があるかもしれません)?この決定は、あなたのデータの必要性と関連性、および経営者が下さなければならない決定に基づいて行います。それはおそらく、あなたが提供した例がどのように設計されたかによるからです。より多くの情報を提供できれば、より適切な回答が得られます。
目的は経営陣に情報の概要を提供することであると述べましたが、年齢を範囲でグループ化すると、5年以上経過した道路の数など、探している情報の一部が非表示になる場合があります。表面処理が必要です。どちらのオプションも生データの要約であり、目的に必要なのは要約のレベルにすぎません。
おそらく、必要なデータ(たとえば、5年以上経過した道路の数)のみを提供し、特定の情報を探したい場合は、生データにドリルダウンできるようにすることで、さらに良い結果が得られるでしょう。