web-dev-qa-db-ja.com

美しいスープオブジェクトからHTMLを取得する方法

次のbs4オブジェクトリストがあります。

>>> listing
<div class="listingHeader">
<h2>
....


>>> type(listing)
<class 'bs4.element.Tag'>

生のhtmlを文字列として抽出したい。私はもう試した:

>>> a = listing.contents
>>> type(a)
<type 'list'>

したがって、これは機能しません。これどうやってするの?

48
user61629

文字列表現 を取得するだけです:

_html_content = str(listing)
_

これは、プリティファイドされていないバージョンです。

きれいにしたい場合は、 prettify() メソッドを使用します。

_html_content = listing.prettify()
_
88
alecxe