統計的に素朴な人に、Multiple R-squared
およびAdjusted R-squared
は?私は次のように単変量回帰分析を行っています:
v.lm <- lm(epm ~ n_days, data=v)
print(summary(v.lm))
結果:
Call:
lm(formula = epm ~ n_days, data = v)
Residuals:
Min 1Q Median 3Q Max
-693.59 -325.79 53.34 302.46 964.95
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 2550.39 92.15 27.677 <2e-16 ***
n_days -13.12 5.39 -2.433 0.0216 *
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 410.1 on 28 degrees of freedom
Multiple R-squared: 0.1746, Adjusted R-squared: 0.1451
F-statistic: 5.921 on 1 and 28 DF, p-value: 0.0216
調整済みR 2乗の「調整」は、変数の数と観測値の数に関連しています。
モデルに変数(予測子)を追加し続けると、R-2乗が向上します(つまり、予測子が分散を説明するように見えます)が、その改善の一部は偶然によるものである可能性があります。したがって、調整されたR-2乗は、比率(N-1)/(N-k-1)を考慮して、これを修正しようとします。ここで、N =観測数、k =変数(予測子)の数です。
単一の変量があるので、それはおそらくあなたのケースでは心配ではありません。
いくつかの参照:
調整済みRの2乗は、R2の値に近いですが、値が異なります。説明された平方和SSRおよび総平方和SSYに基づくのではなく、全体の分散(通常は計算しない量)、s2T = SSY /(n-1)および誤差分散MSEに基づきます(ANOVA表から)、次のように計算されます:調整されたR-2乗=(s2T-MSE)/ s2T。
このアプローチは、説明変数を追加することにより適合の改善を判断するためのより良い基盤を提供しますが、R2が持つ単純な要約解釈はありません。
間違いを犯していない場合は、調整済みのR 2乗とR 2乗の値を次のように確認する必要があります。
s2T <- sum(anova(v.lm)[[2]]) / sum(anova(v.lm)[[1]])
MSE <- anova(v.lm)[[3]][2]
adj.R2 <- (s2T - MSE) / s2T
一方、R2は次のとおりです。SSR/ SSY、SSR = SSY-SSE
attach(v)
SSE <- deviance(v.lm) # or SSE <- sum((epm - predict(v.lm,list(n_days)))^2)
SSY <- deviance(lm(epm ~ 1)) # or SSY <- sum((epm-mean(epm))^2)
SSR <- (SSY - SSE) # or SSR <- sum((predict(v.lm,list(n_days)) - mean(epm))^2)
R2 <- SSR / SSY
Rの2乗は、モデル内の変数の数に依存しません。調整されたR二乗は。
調整されたR-2乗は、説明しようとしている変数とは無関係の変数をモデルに追加するためのペナルティを追加します。これを使用して、変数が説明しようとしているものに関連しているかどうかをテストできます。
調整済みR 2乗は、モデル内の変数の数に依存するように分割を追加したR 2乗です。
予測変数の数に加えて、上記の調整済みR 2乗式もサンプルサイズを調整することに注意してください。サンプルが小さいと、一見大きなR乗が得られます。
Ping Yin&Xitao Fan、J. of Experimental Education 69(2):203-224、 "Estimating R-squared shrink in multiple regression"は、r-squaredを調整するさまざまな方法を比較し、上記の一般的に使用されている方法は良くない。彼らはオルキン&プラットの処方を推奨しています。
しかし、人口の大きさはこれらの式が示すよりもはるかに大きな効果があるという兆候を見てきました。これらの式のいずれも、非常に異なるサンプルサイズで行われた回帰を比較するのに十分であるとは確信していません(例:2,000対200,000サンプル。標準式では、サンプルサイズベースの調整はほとんど行われません)。各サンプルでrの2乗を確認するために、いくつかの相互検証を行います。