.csvファイルで応答する必要があるHTTPSサイトにPOSTリクエストを送信したいと思います。私はこれを持っていますPythonコード:
url = 'https://www.site.com/servlet/datadownload'
values = {
'val1' : '123',
'val2' : 'abc',
'val3' : '1b3',
}
data = urllib.urlencode(values)
req = urllib2.Request(url,data)
response = urllib2.urlopen(req)
myfile = open('file.csv', 'wb')
shutil.copyfileobj(response.fp, myfile)
myfile.close()
しかし、エラーが発生しています:
BadStatusLine: '' (in httplib.py)
Chrome Extension:Advanced REST client (screenshot) で投稿リクエストを試しましたが、問題なく動作します。
何が問題で、どうすれば解決できますか? (HTTPSが原因ですか?)
編集、リファクタリングされたコード:
try:
#conn = httplib.HTTPSConnection(Host="www.site.com", port=443)
=> BadStatusLine: ''
エラーが発生します
conn = httplib.HTTPConnection("www.site.com");
params = urllib.urlencode({'val1':'123','val2':'abc','val3':'1b3'})
conn.request("POST", "/nps/servlet/exportdatadownload", params)
content = conn.getresponse()
print content.reason, content.status
print content.read()
conn.close()
except:
import sys
print sys.exc_info()[:2]
出力:
Found 302
<!DOCTYPE HTML PUBLIC "-//IETF//DTD HTML 2.0//EN">
<HTML><HEAD>
<TITLE>302 Found</TITLE>
</HEAD><BODY>
<H1>Found</H1>
The document has moved <A HREF="https://www.site.com/nps/servlet/exportdatadownload">here</A>.<P>
<HR>
<ADDRESS>Oracle-Application-Server-10g/10.1.3.5.0 Oracle-HTTP-Server Server at mp-www1.mrco.be Port 7778</ADDRESS>
</BODY></HTML>
私は何が間違っているのですか?
BadStatusLine: '' (in httplib.py)
は、ここで何か他のことが起こっている可能性があることを示しています。これは、サーバーが応答をまったく返送せず、接続を閉じるだけの場合に発生する可能性があります。
SSL接続を使用しているとおっしゃったように、これはデバッグするのに特に興味深いかもしれません(curl -v URL
お望みならば)。あなたがそれを見つけたらcurl -2 URL
(SSLv2の使用を強制する)は機能しているようですが、curl -3 URL
(SSLv3)、そうではありません、あなたは問題を見てみたいと思うかもしれません #13636 そしておそらく #1122 python =バグトラッカー。Pythonバージョンと設定が間違っている可能性のあるWebサーバーによっては、問題が発生している可能性があります。SSLのデフォルトがv2.7.3で変更されています。
urllib
を使用しなければならない理由はありますか? Requests はよりシンプルで、ほとんどすべての点で優れており、urllib
の操作を困難にするいくつかの問題を抽象化します。
例として、次のように例を作り直します。
import requests
resp = requests.post(url, data=values, allow_redirects=True)
この時点で、サーバーからの応答はresp.text
で利用可能であり、それを使用してやりたいことができます。リクエストがPOSTを適切に実行できなかった場合(たとえば、カスタムSSL証明書が必要なため)、理由を示すニースエラーメッセージが表示されます。
実稼働環境でこれを実行できない場合でも、ローカルシェルでこれを実行して、requests
から取得するエラーメッセージを確認し、それを使用してurllib
をデバッグします。
conn = httplib.HTTPSConnection(Host='www.site.com', port=443, cert_file=_certfile)
params = urllib.urlencode({'cmd': 'token', 'device_id_st': 'AAAA-BBBB-CCCC',
'token_id_st':'DDDD-EEEE_FFFF', 'product_id':'Unit Test',
'product_ver':"1.6.3"})
conn.request("POST", "servlet/datadownload", params)
content = conn.getresponse().read()
#print response.status, response.reason
conn.close()
サーバーは、欠落しているヘッダー、特にuser-agentとcontent-typeを気に入らない場合があります。 Chrome画像は、これらに使用されるものを示しています。ヘッダーを追加してみてください。
import httplib, urllib
Host = 'www.site.com'
url = '/servlet/datadownload'
values = {
'val1' : '123',
'val2' : 'abc',
'val3' : '1b3',
}
headers = {
'User-Agent': 'python',
'Content-Type': 'application/x-www-form-urlencoded',
}
values = urllib.urlencode(values)
conn = httplib.HTTPSConnection(Host)
conn.request("POST", url, values, headers)
response = conn.getresponse()
data = response.read()
print 'Response: ', response.status, response.reason
print 'Data:'
print data
これはテストされていないコードであり、スクリーンショットに一致するように他のヘッダー値を追加して実験することをお勧めします。それが役に立てば幸い。