web-dev-qa-db-ja.com

2つのy軸を持つSeabornバープロット

以下を考慮するpandas DataFrame:

          labels  values_a  values_b  values_x  values_y
  0       date1      1         3        150       170
  1       date2      2         6        200       180

これをSeabornで簡単にプロットできます(以下のサンプルコードを参照)。ただし、values_a/values_bとvalues_x/values_yの大きな違いにより、values_aとvalues_bのバーは簡単には見えません(実際、上記のデータセットは単なるサンプルであり、実際のデータセットではさらに大きくなっています)。したがって、2つのy軸、つまり、values_a/values_bに1つのy軸、values_x/values_yに1つのy軸を使用したいと思います。 plt.twinx()を使用して2番目の軸を取得しようとしましたが、残念ながら、正しいスケーリングのy軸が少なくとも2つあるにもかかわらず、プロットにはvalues_xとvalues_yの2つのバーしか表示されません。 :) values_a/values_bバーが左のy軸に関連し、values_x/values_yバーが右のy軸に関連するのに対し、それを修正して各ラベルに4本のバーを取得する方法はありますか?

前もって感謝します!

import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns

columns = ["labels", "values_a", "values_b", "values_x", "values_y"]
test_data = pd.DataFrame.from_records([("date1", 1, 3, 150, 170),\
                                       ("date2", 2, 6, 200, 180)],\
                                       columns=columns)

# working example but with unreadable values_a and values_b
test_data_melted = pd.melt(test_data, id_vars=columns[0],\
                           var_name="source", value_name="value_numbers")
g = sns.barplot(x=columns[0], y="value_numbers", hue="source",\
                data=test_data_melted)
plt.show()

# values_a and values_b are not displayed
values1_melted = pd.melt(test_data, id_vars=columns[0],\
                         value_vars=["values_a", "values_b"],\
                         var_name="source1", value_name="value_numbers1")
values2_melted = pd.melt(test_data, id_vars=columns[0],\
                         value_vars=["values_x", "values_y"],\
                         var_name="source2", value_name="value_numbers2")
g1 = sns.barplot(x=columns[0], y="value_numbers1", hue="source1",\
                 data=values1_melted)
ax2 = plt.twinx()
g2 = sns.barplot(x=columns[0], y="value_numbers2", hue="source2",\
                 data=values2_melted, ax=ax2)
plt.show()

Working examplevalues_a/values_b missing

7
Flo1895

これはおそらく複数のサブプロットに最適ですが、実際に単一のプロットに設定されている場合は、プロットする前にデータをスケーリングし、別の軸を作成してから目盛り値を変更できます。

サンプルデータ

import matplotlib.pyplot as plt
import pandas as pd
import seaborn as sns
import numpy as np

columns = ["labels", "values_a", "values_b", "values_x", "values_y"]
test_data = pd.DataFrame.from_records([("date1", 1, 3, 150, 170),\
                                       ("date2", 2, 6, 200, 180)],\
                                       columns=columns)

test_data_melted = pd.melt(test_data, id_vars=columns[0],\
                           var_name="source", value_name="value_numbers")

コード:

# Scale the data, just a simple example of how you might determine the scaling
mask = test_data_melted.source.isin(['values_a', 'values_b'])
scale = int(test_data_melted[~mask].value_numbers.mean()
            /test_data_melted[mask].value_numbers.mean())
test_data_melted.loc[mask, 'value_numbers'] = test_data_melted.loc[mask, 'value_numbers']*scale

# Plot
fig, ax1 = plt.subplots()
g = sns.barplot(x=columns[0], y="value_numbers", hue="source",\
                data=test_data_melted, ax=ax1)

# Create a second y-axis with the scaled ticks
ax1.set_ylabel('X and Y')
ax2 = ax1.twinx()

# Ensure ticks occur at the same positions, then modify labels
ax2.set_ylim(ax1.get_ylim())
ax2.set_yticklabels(np.round(ax1.get_yticks()/scale,1))
ax2.set_ylabel('A and B')

plt.show()

enter image description here

4
ALollz