TypeError: 'str'ではなく、バイトのようなオブジェクトが必要です
csvファイルにHTMLテーブルデータを保存するためにpythonコードの下で実行しながら、上記のエラーを取得します。 rideup.plsが手助けになる方法がわかりません。
import csv
import requests
from bs4 import BeautifulSoup
url='http://www.mapsofindia.com/districts-india/'
response=requests.get(url)
html=response.content
soup=BeautifulSoup(html,'html.parser')
table=soup.find('table', attrs={'class':'tableizer-table'})
list_of_rows=[]
for row in table.findAll('tr')[1:]:
list_of_cells=[]
for cell in row.findAll('td'):
list_of_cells.append(cell.text)
list_of_rows.append(list_of_cells)
outfile=open('./immates.csv','wb')
writer=csv.writer(outfile)
writer.writerow(["SNo", "States", "Dist", "Population"])
writer.writerows(list_of_rows)
最後の行の上に。
あなたはPython 3の代わりにPython 2の方法論を使っています。
変化する:
outfile=open('./immates.csv','wb')
に:
outfile=open('./immates.csv','w')
次のような出力のファイルが得られます。
SNo,States,Dist,Population
1,Andhra Pradesh,13,49378776
2,Arunachal Pradesh,16,1382611
3,Assam,27,31169272
4,Bihar,38,103804637
5,Chhattisgarh,19,25540196
6,Goa,2,1457723
7,Gujarat,26,60383628
.....
Python 3ではcsvはテキストモードで入力を受け取りますが、Python 2ではバイナリモードで入力を受け取ります。
追加用に編集
これが私が走ったコードです:
url='http://www.mapsofindia.com/districts-india/'
html = urllib.request.urlopen(url).read()
soup = BeautifulSoup(html)
table=soup.find('table', attrs={'class':'tableizer-table'})
list_of_rows=[]
for row in table.findAll('tr')[1:]:
list_of_cells=[]
for cell in row.findAll('td'):
list_of_cells.append(cell.text)
list_of_rows.append(list_of_cells)
outfile = open('./immates.csv','w')
writer=csv.writer(outfile)
writer.writerow(['SNo', 'States', 'Dist', 'Population'])
writer.writerows(list_of_rows)
私はPython 3でも同じ問題を抱えていました。私のコードはio.BytesIO()
に書いていました。
io.StringIO()
に置き換えて解決しました。
file = open('parsed_data.txt', 'w')
for link in soup.findAll('a', attrs={'href': re.compile("^http")}): print (link)
soup_link = str(link)
print (soup_link)
file.write(soup_link)
file.flush()
file.close()
私の場合は、BeautifulSoupを使ってPython 3.xで.txtを書きました。同じ問題がありました。 @tsdutebaが言ったように、最初の行の 'wb'を 'w'に変更してください。