以下のコードで:
soup = BeautifulSoup(page.read(), fromEncoding="utf-8")
result = soup.find('div', {'class' :'flagPageTitle'})
次のhtmlが表示されます。
<div id="ctl00_ContentPlaceHolder1_Item65404" class="flagPageTitle" style=" ">
<span></span><p>Some text here</p>
</div>
どうすれば入手することができますか Some text here
タグなし? BeautifulSoup
に相当するInnerTextはありますか?
あなたに必要なのは:
result = soup.find('div', {'class' :'flagPageTitle'}).text
findAll(text=True)
を使用して、テキストノードのみを検索できます。
result = u''.join(result.findAll(text=True))
<p>
を検索して、そのテキストを取得できます。
soup = BeautifulSoup.BeautifulSoup(page.read(), fromEncoding="utf-8")
result = soup.find('div', {'class': 'flagPageTitle'})
result = result.find('p').text