web-dev-qa-db-ja.com

RでreadLines()を使用してURLを読み取るときに、不完全な最終行でエラーが見つかりました

RのreadLines()関数を使用して、URLのhtmlコンテンツを読み取ろうとしています。ただし、"incomplete final line found"警告メッセージは次のとおりですか?そのような場合、どうすれば最終行をスキップできますか?任意の提案をいただければ幸いです。

x <- readLines("https://in.finance.yahoo.com/industries/technology")

Warning message:
In readLines("https://in.finance.yahoo.com/industries/technology") :
  incomplete final line found on 'https://in.finance.yahoo.com/industries/technology'
7
Code_Sipra

ほとんどのファイルには、以下の新しい行のような行末マーカーが欠落しているため、warn = FALSEを使用します。

cat("abc\ndef\nhij", file="test.txt")
readLines( "test.txt")
# [1] "abc" "def" "hij"
# Warning message:
# In readLines("test.txt") : incomplete final line found on 'test.txt'
readLines( "test.txt", warn=FALSE)
# [1] "abc" "def" "hij"
13
Chris S.

私はこの問題に何度も遭遇しました。ほとんどの場合、次の解決策が役立ちました:「エディターでファイルを開き、「Enter」を押して保存しました」。

ただし、このソリューションが機能しないことが一度ありました。したがって、readLines()でオプションwarn = FALSEを設定し、最終結果にはファイル全体から数行しか保存されませんでした。これが私がしたことです。

  1. 私はwarn = "FALSE"でreadLinesを実行しました。データ<-readLines(file、warn = FALSE)
  2. 「データ」の長さを確認しましたlength(data)7258
  3. ファイルを開いて上記の行番号7258に移動しました。次の行に変な文字があり、削除しました。そして、同じファイルの他の多くの行からその文字を削除しました。そしてそれを救った。

ReadLines関数を再度実行したところ、エラーは発生しませんでした。

0
DS_beginner