Urllib2.urlopen(..)を使用するときに、リクエストでカスタムの「Accept」ヘッダーを送信したい。それ、どうやったら出来るの?
そうでもない。 Request
オブジェクトを作成しても実際にはリクエストは送信されず、RequestオブジェクトにはRead()
メソッドがありません。 (また:read()
は小文字です。)必要なことは、Request
をurlopen()
への最初の引数として渡すことだけです。
import urllib2
request = urllib2.Request("http://www.google.com", headers={"Accept" : "text/html"})
contents = urllib2.urlopen(request).read()
私は通常使用します:
import urllib2
request_headers = {
"Accept-Language": "en-US,en;q=0.5",
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:40.0) Gecko/20100101 Firefox/40.0",
"Accept": "text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8",
"Referer": "http://thewebsite.com",
"Connection": "keep-alive"
}
request = urllib2.Request("https://thewebsite.com", headers=request_headers)
response = urllib2.urlopen(request).read()
print(response)
既に述べた他のソリューションのほかに、add_header
方法。
したがって、py @pantsgolemで提供される例は次のようになります。
import urllib2
request = urllib2.Request("http://www.google.com")
request.add_header('Accept','text/html')
##Show the header having the key 'Accept'
request.get_header('Accept')
response = urllib2.urlopen(request)
response.read()