HTTP POSTリクエストの作成

Question

私はPOST本に関する情報を取得するリクエストを作成しようとしています。HTTPコードを返すコードは次のとおりです：302、Moved

import httplib, urllib params = urllib.urlencode({ 'isbn' : '9780131185838', 'catalogId' : '10001', 'schoolStoreId' : '15828', 'search' : 'Search' }) headers = {"Content-type": "application/x-www-form-urlencoded", "Accept": "text/plain"} conn = httplib.HTTPConnection("bkstr.com:80") conn.request("POST", "/webapp/wcs/stores/servlet/BuybackSearch", params, headers) response = conn.getresponse() print response.status, response.reason data = response.read() conn.close()

ブラウザからこのページから試してみると、 http://www.bkstr.com/webapp/wcs/stores/servlet/BuybackMaterialsView?langId=-1&catalogId=10001&storeId=10051&schoolStoreId=15828 、それ動作します。私のコードには何が欠けていますか？

編集：print response.msgを呼び出すと、次のようになります

302 Moved Date: Tue, 07 Sep 2010 16:54:29 GMT Vary: Host,Accept-Encoding,User-Agent Location: http://www.bkstr.com/webapp/wcs/stores/servlet/BuybackSearch X-UA-Compatible: IE=EmulateIE7 Content-Length: 0 Content-Type: text/plain; charset=utf-8

場所は、私が最初にアクセスしようとしている同じURLを指しているようです？

EDIT2：

ここで提案したように、urllib2を使用してみました。コードは次のとおりです。

import urllib, urllib2 url = 'http://www.bkstr.com/webapp/wcs/stores/servlet/BuybackSearch' values = {'isbn' : '9780131185838', 'catalogId' : '10001', 'schoolStoreId' : '15828', 'search' : 'Search' } data = urllib.urlencode(values) req = urllib2.Request(url, data) response = urllib2.urlopen(req) print response.geturl() print response.info() the_page = response.read() print the_page

出力は次のとおりです。

http://www.bkstr.com/webapp/wcs/stores/servlet/BuybackSearch Date: Tue, 07 Sep 2010 16:58:35 GMT Pragma: No-cache Cache-Control: no-cache Expires: Thu, 01 Jan 1970 00:00:00 GMT Set-Cookie: JSESSIONID=0001REjqgX2axkzlR6SvIJlgJkt:1311s25dm; Path=/ Vary: Accept-Encoding,User-Agent X-UA-Compatible: IE=EmulateIE7 Content-Length: 0 Connection: close Content-Type: text/html; charset=utf-8 Content-Language: en-US Set-Cookie: TSde3575=225ec58bcb0fdddfad7332c2816f1f152224db2f71e1b0474c866f3b; Path=/

ars · Accepted Answer

彼らのサーバーは、適切なCookieを取得することを望んでいるようです。これは動作します：

import urllib, urllib2, cookielib cookie_jar = cookielib.CookieJar() opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie_jar)) urllib2.install_opener(opener) # acquire cookie url_1 = 'http://www.bkstr.com/webapp/wcs/stores/servlet/BuybackMaterialsView?langId=-1&catalogId=10001&storeId=10051&schoolStoreId=15828' req = urllib2.Request(url_1) rsp = urllib2.urlopen(req) # do POST url_2 = 'http://www.bkstr.com/webapp/wcs/stores/servlet/BuybackSearch' values = dict(isbn='9780131185838', schoolStoreId='15828', catalogId='10001') data = urllib.urlencode(values) req = urllib2.Request(url_2, data) rsp = urllib2.urlopen(req) content = rsp.read() # print result import re pat = re.compile('Title:.*') print pat.search(content).group() # OUTPUT: Title:&nbsp;&nbsp;Statics & Strength of Materials for Arch (w/CD)<br />

Mark · Answer

rllib2 モジュールを使用することをお勧めします。このモジュールはリダイレクトの処理を改善するである必要があります。 urllib2での [〜＃〜] posting [〜＃〜] の例を次に示します。

loevborg · Answer

おそらくそれはブラウザが取得するものであり、あなたはただ302リダイレクト。
他のすべてが失敗した場合、FireBugまたはtcpdumpまたはwiresharkを使用してFirefoxとWebサーバー間のダイアログを監視し、どのHTTPヘッダーが異なるかを確認できます。おそらくUser Agent:ヘッダー。