私は使っている geom_smooth
から ggplot2
パッケージを使用して、時系列散布図に平滑化された線を作成します(1年の各日に1ポイントなので、365ポイントあります)。引数の1つはspan
と呼ばれ、ヘルプファイル(?geom_smooth
)次の説明があります。
span
は、デフォルトのレススムーザーのスムージングの量を制御します。数値が小さいほど線が細くなり、数値が大きいほど線が滑らかになります。
ただし、これは実際には、span引数が何を制御しているかを教えてくれません。 1に設定しても意味がなく、0.1に設定すると見栄えが良くなります。
span = 0.5
span = 0.1
ただし、プロットを説明するとき、span
が実際に何を変更するのか完全にはわからないため、平滑化された線を説明する方法がわかりません。ポインタはありますか?
スパン(アルファも定義)は、データを平滑化するときに移動するウィンドウの幅を決定します。
「レスフィットでは、alphaパラメーターがスライディングウィンドウの幅を決定します。より具体的には、alphaは、各局所回帰で使用される観測値の比率を示します。したがって、このパラメーターは0〜1の値として指定されます。図2のレス曲線に使用されるアルファ値は0.65であるため、その曲線を作成するために使用される各局所回帰には、合計データポイントの65%が組み込まれます。」
から取得:
Jacoby(2000)Loess ::変数間の関係を描写するためのノンパラメトリックなグラフィカルツール。選挙研究19-4。 (ペイウォール紙)
詳細については、参照されている論文を確認してください。
LOESS平滑化は、重み付けされたスライディングウィンドウの平均を使用して最適な線を計算する、ノンパラメトリック形式の回帰です。各「ウィンドウ」内で、加重平均が計算され、スライディングウィンドウがx軸に沿って通過します。
Span引数を使用して、このウィンドウのサイズを制御できます。スパン要素は、平滑化の程度であるアルファを制御します。スパンが小さいほど、「ウィンドウ」が小さくなるため、ノイズが多くなり、線がギザギザになります。
スパンではなくLOESSでドキュメントを探します。