web-dev-qa-db-ja.com

ggplotの帯域幅の意味geom_smooth lm

次のコードで:

library(ggplot2)
ggplot(mtcars, aes(x=wt, y=mpg)) +
    geom_point(aes(colour=factor(cyl))) +
    geom_smooth(method="lm")

私はこのプロットを得ることができます:

enter image description here

私の質問は、グレーゾーンがどのように定義されているのですか?それの意味は何ですか。そして、そのバンドの幅を制御するさまざまなパラメーターをどのように試すことができますか?

24
neversaint

既定では、線形モデル( "lm")からの予測の95%信頼レベル間隔です。 ?geom_smoothのドキュメントには、次のことが記載されています。

このgeomのデフォルトのstatはstat_smooth基礎となる統計変換を制御するためのその他のオプションについてのドキュメントを参照してください。

?stat_smoothのドキュメントを1レベル深く掘り下げると、スムーザーの面積を計算するために使用される方法がわかります。

迅速な結果を得るために、stat_smoothの引数の1つで遊ぶことができます。これはlevel使用する信頼区間のレベル(デフォルトでは0.95)

そのパラメーターをgeom_smoothに渡すことで、順番にstat_smoothに渡されるため、より狭い領域を使用したい場合は、たとえば.90を信頼度として使用できますレベル:

ggplot(mtcars, aes(x=wt, y=mpg)) +
    geom_point(aes(colour=factor(cyl))) +
    geom_smooth(method="lm", level=0.90)

enter image description here

28
Dominic Comtois

信頼区間です。表示しない場合は、se=FALSEを使用できます。 95%CIではなく99%CIを使用する場合は、level = 0.99を使用することもできます。詳細については、?stat_smoothを参照してください。

7
shadow