次のbs4オブジェクトリストがあります。
>>> listing
<div class="listingHeader">
<h2>
....
>>> type(listing)
<class 'bs4.element.Tag'>
生のhtmlを文字列として抽出したい。私はもう試した:
>>> a = listing.contents
>>> type(a)
<type 'list'>
したがって、これは機能しません。これどうやってするの?
文字列表現 を取得するだけです:
_html_content = str(listing)
_
これは、プリティファイドされていないバージョンです。
きれいにしたい場合は、 prettify()
メソッドを使用します。
_html_content = listing.prettify()
_