seaborn
を使用して、複数のデータフレームをポイントプロットとしてプロットしています。また、すべてのデータフレームを同じ軸にプロットしています。
どのように凡例をプロットに追加しますか?
私のコードは各データフレームを取得し、同じ図に次々にプロットします。
各データフレームには同じ列があります
date count
2017-01-01 35
2017-01-02 43
2017-01-03 12
2017-01-04 27
私のコード:
f, ax = plt.subplots(1, 1, figsize=figsize)
x_col='date'
y_col = 'count'
sns.pointplot(ax=ax,x=x_col,y=y_col,data=df_1,color='blue')
sns.pointplot(ax=ax,x=x_col,y=y_col,data=df_2,color='green')
sns.pointplot(ax=ax,x=x_col,y=y_col,data=df_3,color='red')
これは、同じプロット上に3行をプロットします。ただし、凡例はありません。 ドキュメント はlabel
引数を受け入れません。
有効な回避策の1つは、新しいデータフレームを作成し、hue argument
を使用することでした。
df_1['region'] = 'A'
df_2['region'] = 'B'
df_3['region'] = 'C'
df = pd.concat([df_1,df_2,df_3])
sns.pointplot(ax=ax,x=x_col,y=y_col,data=df,hue='region')
しかし、最初に図に順次ポイントプロットを追加し、次に凡例を追加するコードの凡例を作成する方法があるかどうかを知りたいです。
サンプル出力:
プロットにはseaborn pointplot
を使用しないことをお勧めします。これにより、物事が不必要に複雑になります。
代わりにmatplotlib plot_date
を使用します。これにより、プロットにラベルを設定し、ax.legend()
で凡例に自動的にラベルを付けることができます。
import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
import numpy as np
date = pd.date_range("2017-03", freq="M", periods=15)
count = np.random.Rand(15,4)
df1 = pd.DataFrame({"date":date, "count" : count[:,0]})
df2 = pd.DataFrame({"date":date, "count" : count[:,1]+0.7})
df3 = pd.DataFrame({"date":date, "count" : count[:,2]+2})
f, ax = plt.subplots(1, 1)
x_col='date'
y_col = 'count'
ax.plot_date(df1.date, df1["count"], color="blue", label="A", linestyle="-")
ax.plot_date(df2.date, df2["count"], color="red", label="B", linestyle="-")
ax.plot_date(df3.date, df3["count"], color="green", label="C", linestyle="-")
ax.legend()
plt.gcf().autofmt_xdate()
plt.show()
sns.pointplot(ax=ax,x=x_col,y=y_col,data=df1,color='blue')
sns.pointplot(ax=ax,x=x_col,y=y_col,data=df2,color='green')
sns.pointplot(ax=ax,x=x_col,y=y_col,data=df3,color='red')
ax.legend(handles=ax.lines[::len(df1)+1], labels=["A","B","C"])
ax.set_xticklabels([t.get_text().split("T")[0] for t in ax.get_xticklabels()])
plt.gcf().autofmt_xdate()
plt.show()
古い質問ですが、もっと簡単な方法があります。
sns.pointplot(x=x_col,y=y_col,data=df_1,color='blue')
sns.pointplot(x=x_col,y=y_col,data=df_2,color='green')
sns.pointplot(x=x_col,y=y_col,data=df_3,color='red')
plt.legend(labels=['legendEntry1', 'legendEntry2', 'legendEntry3'])
これにより、プロットを順番に追加でき、凡例項目を定義する以外にmatplotlibの問題を心配する必要はありません。