Webからのダウンロード中のエラーを処理するためのtrycatch
コードを書きたいです。
url <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz")
y <- mapply(readLines, con=url)
これら2つのステートメントは正常に実行されます。以下に、私は存在しないWebアドレスを作成します。
url <- c("xxxxx", "http://en.wikipedia.org/wiki/Xz")
url[1]
は存在しません。どのようにtrycatch
ループ(関数)を書くのですか:
それでは:Rの世界へようこそ;-)
どうぞ
urls <- c(
"http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html",
"http://en.wikipedia.org/wiki/Xz",
"xxxxx"
)
readUrl <- function(url) {
out <- tryCatch(
{
# Just to highlight: if you want to use more than one
# R expression in the "try" part then you'll have to
# use curly brackets.
# 'tryCatch()' will return the last evaluated expression
# in case the "try" part was completed successfully
message("This is the 'try' part")
readLines(con=url, warn=FALSE)
# The return value of `readLines()` is the actual value
# that will be returned in case there is no condition
# (e.g. warning or error).
# You don't need to state the return value via `return()` as code
# in the "try" part is not wrapped insided a function (unlike that
# for the condition handlers for warnings and error below)
},
error=function(cond) {
message(paste("URL does not seem to exist:", url))
message("Here's the original error message:")
message(cond)
# Choose a return value in case of error
return(NA)
},
warning=function(cond) {
message(paste("URL caused a warning:", url))
message("Here's the original warning message:")
message(cond)
# Choose a return value in case of warning
return(NULL)
},
finally={
# NOTE:
# Here goes everything that should be executed at the end,
# regardless of success or error.
# If you want more than one expression to be executed, then you
# need to wrap them in curly brackets ({...}); otherwise you could
# just have written 'finally=<expression>'
message(paste("Processed URL:", url))
message("Some other message at the end")
}
)
return(out)
}
> y <- lapply(urls, readUrl)
Processed URL: http://stat.ethz.ch/R-manual/R-devel/library/base/html/connections.html
Some other message at the end
Processed URL: http://en.wikipedia.org/wiki/Xz
Some other message at the end
URL does not seem to exist: xxxxx
Here's the original error message:
cannot open the connection
Processed URL: xxxxx
Some other message at the end
Warning message:
In file(con, "r") : cannot open file 'xxxxx': No such file or directory
> head(y[[1]])
[1] "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">"
[2] "<html><head><title>R: Functions to Manipulate Connections</title>"
[3] "<meta http-equiv=\"Content-Type\" content=\"text/html; charset=utf-8\">"
[4] "<link rel=\"stylesheet\" type=\"text/css\" href=\"R.css\">"
[5] "</head><body>"
[6] ""
> length(y)
[1] 3
> y[[3]]
[1] NA
tryCatch
tryCatch
は、エラーまたは警告がない限り、expr
の実行に関連付けられた値を返します。この場合、それぞれのハンドラ関数を提供することで特定の戻り値(上記のreturn(NA)
を参照)を指定できます(?tryCatch
の引数error
とwarning
を参照)。これらはすでに存在している関数であるかもしれませんが、tryCatch()
の中でそれらを定義することもできます(上記のように)。
ハンドラ関数の特定の戻り値を選択することの意味
エラーの場合にはNA
が返されるように指定したので、y
の3番目の要素はNA
です。戻り値としてNULL
を選択した場合、lapply()
は単にy
である戻り値を「無視」するため、NULL
の長さは2
ではなく3
になります。また、return()
を介して明示的な戻り値を指定しないと、ハンドラー関数はNULL
を返します(エラーまたは警告の場合)。調子)。
「望ましくない」という警告メッセージ
warn=FALSE
は何の効果もないように思われるので、警告を抑制するための別の方法(この場合は実際には関係ありません)を使用することです。
suppressWarnings(readLines(con=url))
の代わりに
readLines(con=url, warn=FALSE)
複数の式
(expr
の部分で説明したように)それらを中括弧で囲むと、「実際の式の部分」(tryCatch()
の引数finally
)に複数の式を入れることもできます。
Rはtry-catchブロックを実装するための関数を使用します。
構文は多少次のようになります。
result = tryCatch({
expr
}, warning = function(warning_condition) {
warning-handler-code
}, error = function(error_condition) {
error-handler-code
}, finally={
cleanup-code
})
TryCatch()には、「警告」と「エラー」という2つの「条件」を処理できます。コードの各ブロックを書くときに理解するべき重要なことは実行の状態とスコープです。 @ source
これは簡単な例です。
# Do something, or tell me why it failed
my_update_function <- function(x){
tryCatch(
# This is what I want to do...
{
y = x * 2
return(y)
},
# ... but if an error occurs, tell me what happened:
error=function(error_message) {
message("This is my custom message.")
message("And below is the error message from R:")
message(error_message)
return(NA)
}
)
}
「警告」もキャプチャしたい場合は、warning=
の部分に似たerror=
を追加するだけです。
私はちょうどirr関数のためにtryCatchを解決しようとしていた私の人生の2日間を失ったので、私は自分の知恵を共有すべきだと思いました(そして何が足りないのか)。 FYI-irrは、この場合はFinCalからの実際の関数であり、大きなデータセットでいくつかのケースでエラーが発生しました。
関数の一部としてtryCatchを設定します。例えば:
irr2 <- function (x) {
out <- tryCatch(irr(x), error = function(e) NULL)
return(out)
}
エラー(または警告)が機能するためには、実際には関数を作成する必要があります。私はもともとエラーの部分のためにerror = return(NULL)
を書いただけで、すべての値はnullになりました。
サブ出力(私の "out"のような)を作成してreturn(out)
にすることを忘れないでください。
tryCatch
はやや複雑な構文構造を持ちます。しかし、以下に示すようにtryCatchの呼び出し全体を構成する4つの部分を理解したら、覚えやすくなります。
expr:[必須]評価対象のRコード
error:[省略可能] exprのコードを評価中にエラーが発生した場合に実行するべきこと
warning:[省略可能] exprのコードを評価中に警告が発生した場合に実行する必要があるもの
finally:[オプション] exprが正常に実行されたかどうかにかかわらず、エラーが発生した場合、または次のようにしてtryCatch呼び出しを終了する直前に実行する必要があります。警告
tryCatch(
expr = {
# Your code...
# goes here...
# ...
},
error = function(e){
# (Optional)
# Do this if an error is caught...
},
warning = function(w){
# (Optional)
# Do this if an warning is caught...
},
finally = {
# (Optional)
# Do this at the end before quitting the tryCatch structure...
}
)
したがって、値の対数を計算するためのおもちゃの例は、次のようになります。
log_calculator <- function(x){
tryCatch(
expr = {
message(log(x))
message("Successfully executed the log(x) call.")
},
error = function(e){
message('Caught an error!')
print(e)
},
warning = function(w){
message('Caught an warning!')
print(w)
},
finally = {
message('All done, quitting.')
}
)
}
今、3つのケースを実行します。
有効なケース
log_calculator(10)
# 2.30258509299405
# Successfully executed the log(x) call.
# All done, quitting.
「警告」の場合
log_calculator(-10)
# Caught an warning!
# <simpleWarning in log(x): NaNs produced>
# All done, quitting.
"エラー"の場合
log_calculator("log_me")
# Caught an error!
# <simpleError in log(x): non-numeric argument to mathematical function>
# All done, quitting.
私がよく使ういくつかの便利なユースケースについて書きました。詳細はこちら: https://rsangole.netlify.com/post/try-catch/
これが役に立つことを願っています。