Distplotを使用してヒストグラムをプロットする場合、y軸の単位は何ですか?さまざまなヒストグラムを通常の近似と一緒にプロットしましたが、ある場合には0〜0.9の範囲で、別の場合では0〜4.5の範囲であることがわかりました。
help(sns.distplot)
から:
norm_hist
:bool、otional Trueの場合、ヒストグラムの高さはカウントではなく密度を示します。これは、KDEまたは近似密度がプロットされている場合に暗示されます。
A 密度は、曲線の下の領域が1になるようにスケーリングされるため、個々のビンが1よりも高くなることはありません(データセット全体)。ただし、kde
はデフォルトでTrue
であり、norm_hist
をオーバーライドするため、norm_hist
は、kde
をFalse
に明示的に設定した場合にのみ、y単位を変更します。
import matplotlib.pyplot as plt
import numpy as np
import seaborn as sns
fig, axs = plt.subplots(figsize=(6,6), ncols=2, nrows=2)
data = np.random.randint(0,20,40)
for row in (0,1):
for col in (0,1):
sns.distplot(data, kde=row, norm_hist=col, ax=axs[row, col])
axs[0,0].set_ylabel('NO kernel density')
axs[1,0].set_ylabel('KDE on')
axs[1,0].set_xlabel('norm_hist=False')
axs[1,1].set_xlabel('norm_hist=True')