ロジスティック回帰を実行したいのですが、エラーが発生します-間違いがどこにあるのかわかりません。
私のデータの構造:
'data.frame': 3911 obs. of 29 variables:
$ vn1 : Factor w/ 2 levels "maennlich","weiblich": 1 1 2 1 1 2 1 1 1 1 ...
$ vn2c : int 1976 1943 1927 1949 1965 1977 1986 1976 1944 1994 ...
$ vn35 : Factor w/ 7 levels "keine Angabe",..: 6 4 5 3 3 5 7 6 5 5 ...
$ v39 : Factor w/ 8 levels "keine Angabe",..: 8 4 5 8 7 7 5 6 6 6 ...
$ n39 : Factor w/ 9 levels "keine Angabe",..: 4 4 4 4 4 4 4 4 4 4 ...
$ v41 : Factor w/ 7 levels "keine Angabe",..: 6 5 5 2 7 7 5 5 6 6 ...
$ n41 : Factor w/ 7 levels "keine Angabe",..: 4 4 4 4 4 4 4 4 4 4 ...
$ vn42a : Factor w/ 8 levels "keine Angabe",..: 8 4 8 8 5 5 6 6 6 4 ...
$ vn42b : Factor w/ 8 levels "keine Angabe",..: 5 4 7 5 5 5 6 7 6 5 ...
$ vn43a : Factor w/ 8 levels "keine Angabe",..: 7 5 8 6 2 6 6 2 7 7 ...
$ vn43b : Factor w/ 8 levels "keine Angabe",..: 7 4 6 4 4 7 6 2 6 5 ...
$ vn62 : Factor w/ 14 levels "keine Angabe",..: 8 11 9 2 3 3 8 6 5 7 ...
$ vn119a : Factor w/ 15 levels "keine Angabe",..: 6 3 8 14 10 8 14 8 6 6 ...
$ ostwest : Factor w/ 2 levels "Ost","West": 2 2 2 2 2 2 2 2 2 2 ...
$ prefmerkel : Factor w/ 2 levels "Steinbrueck",..: 1 2 2 NA NA NA 2 2 1 1 ...
$ angst : num 1 3 2 4 4 2 0 1 2 2 ...
$ crisismerkel : num 0 4 3 0 1 1 3 2 2 2 ...
$ leadership42 : Factor w/ 5 levels "trifft ueberhaupt nicht zu",..: 5 1 5 5 2 2 3 3 3 1 ...
$ leadership43 : Factor w/ 5 levels "trifft ueberhaupt nicht zu",..: 4 2 5 3 NA 3 3 NA 4 4 ...
$ leadership : num 1 -1 0 2 NA -1 0 NA -1 -3 ...
$ trustworthiness42: Factor w/ 5 levels "trifft ueberhaupt nicht zu",..: 2 1 4 2 2 2 3 4 3 2 ...
$ trustworthiness43: Factor w/ 5 levels "trifft ueberhaupt nicht zu",..: 4 1 3 1 1 4 3 NA 3 2 ...
$ trustworthiness : num -2 0 1 1 1 -2 0 NA 0 0 ...
$ ideology : num 5 8 6 NA NA NA 5 3 2 4 ...
$ pid : Factor w/ 10 levels "none","CDU/CSU",..: 3 2 5 1 7 5 1 5 3 3 ...
$ age : num 37 70 86 64 48 36 27 37 69 19 ...
$ agegroups : Factor w/ 7 levels "bis 25 Jahre",..: 3 6 7 5 4 3 2 3 6 1 ...
$ gender : Factor w/ 2 levels "male","female": 1 1 2 1 1 2 1 1 1 1 ...
$ region : Factor w/ 2 levels "west","east": 1 1 1 1 1 1 1 1 1 1 ...
回帰コマンドは次のエラーを返します。
summary(glm(prefmerkel~angst+crisismerkel+leadership+trustworthiness+ideology+pid+agegroups+gender+region,data=gles))
Error in glm.fit(x = c(1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, :
NA/NaN/Inf in 'y'
In addition: Warning messages:
1: In Ops.factor(y, mu) : ‘-’ nicht sinnvoll für Faktoren
2: In Ops.factor(eta, offset) : ‘-’ nicht sinnvoll für Faktoren
3: In Ops.factor(y, mu) : ‘-’ nicht sinnvoll für Faktoren
因子/カテゴリカル応答変数を持つことはできません。
図:
> d=data.frame(f=factor(c(1,2,1,2,1,2)),x=runif(6))
> glm(f~x,data=d)
Error in glm.fit(x = c(1, 1, 1, 1, 1, 1, 0.351715633412823, 0.449422287056223, :
NA/NaN/Inf in 'y'
In addition: Warning messages:
1: In Ops.factor(y, mu) : - not meaningful for factors
2: In Ops.factor(eta, offset) : - not meaningful for factors
3: In Ops.factor(y, mu) : - not meaningful for factors
本当にロジスティック回帰を実行したい場合は、それらを0と1、またはFALSEとTRUEに変更し、family=binomial
を使用する必要があります。
# recode d$f==2 as TRUE, else FALSE
d$f=d$f=="2"
# fit
glm(f~x,data=d,family=binomial)
Call: glm(formula = f ~ x, family = binomial, data = d)
Coefficients:
(Intercept) x
-0.9066 1.8922
Degrees of Freedom: 5 Total (i.e. Null); 4 Residual
Null Deviance: 8.318
Residual Deviance: 8.092 AIC: 12.09
変数が二項式の場合は、「family = binomial」と記述します。これは問題を解決します
このページは、このエラーの検索で高く表示されているため、線形回帰とロジスティック回帰を使用しない別の理由を追加します。 Yulia と同じ問題があり、log-transformedの予測子がいくつかあり、ここで説明するエラーが発生しました。
エラーの理由は、対数変換の前に値が0の行がある場合、これらは-Inf
になり、回帰がエラーをスローする結果になるためです。解決策は、そのような変数の対数変換を控えるか、0値の行がないことを確認することです(例: スタック交換に関する説明 を参照)。
私の場合、それは上記のどれでもありませんでした。右に歪んだ変数を対数変換しましたが、それを使用すると、対数回帰によってこのエラーが発生しました。元の(変換されていない)バリアントを使用したとき、それは完璧に機能しました。