web-dev-qa-db-ja.com

open-uriで503エラーを処理するにはどうすればよいですか?

ウェブサイトが「503serviceavailable」エラーを返した場合、open-uriは例外をスローします。例えば:

require 'open-uri'
open('http://www.google.co.uk/sorry/?continue=http://www.google.co.uk/search%3Fq%3Dhello%26oq%3Dhello%26ie%3DUTF-8')
# OpenURI::HTTPError: 503 Service Unavailable
# ...

ただし、その後Webブラウザーでアクセスすると、実際にはCAPTCHAを含むページが表示され、エラーは表示されません。

Open-uriがこれを例外としてスローするだけでなく、実際に応答を処理してページコンテンツを提供することを確認するにはどうすればよいですか?

26

OpenURI::HTTPError必要なものを取得するために検査できるio属性があります。 ioStringIOオブジェクトであり、いくつかのシングルトンメソッドが定義されています(たとえば、status)。

require 'open-uri'
begin
  open('http://www.google.co.uk/sorry/?continue=http://www.google.co.uk/search%3Fq%3Dhello%26oq%3Dhello%26ie%3DUTF-8')
rescue OpenURI::HTTPError => error
  response = error.io
  response.status
  # => ["503", "Service Unavailable"] 
  response.string
  # => <!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html DIR=\"LTR\">\n<head><meta http-equiv=\"content-type\" content=\"text/html; charset=utf-8\"><meta name=\"viewport\" content=\"initial-scale=1\">...
end    

ただし、このタスクの場合、Net::HTTPモジュールはおそらくより良い代替手段です:

require 'net/http'
response = Net::HTTP.get_response(URI.parse('http://www.google.co.uk/sorry/?continue=http://www.google.co.uk/search%3Fq%3Dhello%26oq%3Dhello%26ie%3DUTF-8'))
response.code
# => "503"
response.body
# => "<!DOCTYPE html PUBLIC \"-//W3C//DTD HTML 4.01 Transitional//EN\">\n<html DIR=\"LTR\">\n<head><meta http-equiv=\"content-type\" content=\"text/html; ...
49
toro2k