RのMLEエラー：「vmmin」の初期値が有限ではありません

Question

2つのdata.frameオブジェクトがあるとします。

df1 <- data.frame(x = 1:100) df1$y <- 20 + 0.3 * df1$x + rnorm(100) df2 <- data.frame(x = 1:200000) df2$y <- 20 + 0.3 * df2$x + rnorm(200000)

MLEをやりたいです。 df1を使用すると、すべてが正常です。

LL1 <- function(a, b, mu, sigma) { R = dnorm(df1$y - a- b * df1$x, mu, sigma) -sum(log(R)) } library(stats4) mle1 <- mle(LL1, start = list(a = 20, b = 0.3, sigma=0.5), fixed = list(mu = 0)) > mle1 Call: mle(minuslogl = LL1, start = list(a = 20, b = 0.3, sigma = 0.5), fixed = list(mu = 0)) Coefficients: a b mu sigma 23.89704180 0.07408898 0.00000000 3.91681382

しかし、df2で同じタスクを実行すると、エラーが発生します。

LL2 <- function(a, b, mu, sigma) { R = dnorm(df2$y - a- b * df2$x, mu, sigma) -sum(log(R)) } mle2 <- mle(LL2, start = list(a = 20, b = 0.3, sigma=0.5), fixed = list(mu = 0)) Error in optim(start, f, method = method, hessian = TRUE, ...) : initial value in 'vmmin' is not finite

どうすれば克服できますか？

javlacalle · Accepted Answer

Rの値は、ある時点でゼロになります。関数の非有限値が最小化され、エラーが返されます。

引数log=TRUEを使用すると、この問題をより適切に処理できます。以下の関数LL3を参照してください。以下はいくつかの警告を示しますが、パラメーター推定値が真のパラメーターに近い結果が返されます。

require(stats4) set.seed(123) e <- rnorm(200000) x <- 1:200000 df3 <- data.frame(x) df3$y <- 20 + 0.3 * df3$x + e LL3 <- function(a, b, mu, sigma) { -sum(dnorm(df3$y - a- b * df3$x, mu, sigma, log=TRUE)) } mle3 <- mle(LL3, start = list(a = 20, b = 0.3, sigma=0.5), fixed = list(mu = 0)) Warning messages: 1: In dnorm(df3$y - a - b * df3$x, mu, sigma, log = TRUE) : NaNs produced 2: In dnorm(df3$y - a - b * df3$x, mu, sigma, log = TRUE) : NaNs produced 3: In dnorm(df3$y - a - b * df3$x, mu, sigma, log = TRUE) : NaNs produced 4: In dnorm(df3$y - a - b * df3$x, mu, sigma, log = TRUE) : NaNs produced 5: In dnorm(df3$y - a - b * df3$x, mu, sigma, log = TRUE) : NaNs produced 6: In dnorm(df3$y - a - b * df3$x, mu, sigma, log = TRUE) : NaNs produced 7: In dnorm(df3$y - a - b * df3$x, mu, sigma, log = TRUE) : NaNs produced 8: In dnorm(df3$y - a - b * df3$x, mu, sigma, log = TRUE) : NaNs produced > mle3 Call: mle(minuslogl = LL3, start = list(a = 20, b = 0.3, sigma = 0.5), fixed = list(mu = 0)) Coefficients: a b mu sigma 19.999166 0.300000 0.000000 1.001803

Douglas K · Answer

対数尤度関数を最小化するときにも同じ問題がありました。デバッグの結果、問題が私の開始値にあることがわかりました。特定の行列の行列式が0になるため、ログの取得時にエラーが発生しました。したがって、「有限」値を見つけることができませんでしたが、それは関数が最適化にエラーを返したためです。

結論：開始値を使用して実行したときに関数がエラーを返さないかどうかを検討してください。

PS .: Marius Hofertは完全に正しいです。警告を抑制しないでください。

結論：開始値を使用して実行したときに関数がエラーを返さないかどうかを検討してください。

PS .: Marius Hofertは完全に正しいです。警告を抑制しないでください。