PythonのBeautifulSoupは初めてで、BeautifulSoupからdict
を抽出しようとしています。
BeautifulSoupを使用してJSONを抽出し、_beautifulsoup.beautifulsoup
_変数soup
を取得しました。
soup
から値を取得しようとしていますが、result = soup.findAll("bill")
を実行すると、空のリスト_[]
_が取得されます。スープを抽出してdict
の結果を取得するにはどうすればよいですか。
_{u'congress': 113,
u'number': 325,
u'title': u'A bill to ensure the complete and timely payment of the obligations of the United States Government until May 19, 2013, and for other purposes.',
u'type': u'hr'}
print type(soup)
print soup
_
=>以下の結果
_BeautifulSoup.BeautifulSoup
{
"bill": {
"congress": 113,
"number": 325,
"title": "A bill to ensure the complete and timely payment of the obligations of the United States Government until May 19, 2013, and for other purposes.",
"type": "hr"
},
"category": "passage",
"chamber": "s"
}
_
[〜#〜] update [〜#〜]
soup
を取得した方法は次のとおりです。
_from BeautifulSoup import BeautifulSoup
import urllib2
url = urllib2.urlopen("https://www.govtrack.us/data/congress/113/votes/2013/s11/data.json")
content = url.read()
soup = BeautifulSoup(content)
_
BeautifulSoupにはあまり詳しくありませんが、JSONをデコードする必要がある場合
import json
newDictionary=json.loads(str(soup))
BeautifulSoup
を削除できます:
import json
import urllib2
url = "https://www.govtrack.us/data/congress/113/votes/2013/s11/data.json"
data = json.load(urllib2.urlopen(url))