web-dev-qa-db-ja.com

信じられないほど基本的なlxmlの質問:lxml.etree._ElementのHTML /文字列コンテンツを取得しますか?

これは、私が実際にドキュメントでそれを見つけることができないほど基本的な質問です:-/

以下では:

_img = house_tree.xpath('//img[@id="mainphoto"]')[0]
_

_<img/>_タグのHTMLを取得するにはどうすればよいですか?

私はhtml_content()を追加しようとしましたが、_AttributeError: 'lxml.etree._Element' object has no attribute 'html_content'_を取得します。

また、それは内部にいくつかのコンテンツを含むタグでした(例:_<p>text</p>_)コンテンツ(例:text)を取得するにはどうすればよいですか?

どうもありがとう!

31
AP257

私はそれが次のように単純になると思います:

from lxml.etree import tostring
inner_html = tostring(img)

中からコンテンツを取得することについては<p>、たとえば、いくつかの選択された要素el

content = el.text_content()
57
vonPetrushev