パッケージを更新すると、次の新しいエラーが発生します。
class TreeBuilderForHtml5lib(html5lib.treebuilders._base.TreeBuilder):
AttributeError: 'module' object has no attribute '_base'
beautifulsoup
を更新しようとしましたが、結果はありません。どうすれば修正できますか?
edit2017年11月:これはもう機能しないようです
最後に判明したのは、検索エンジンは何も投げなかったが、それはbeautifulsoupの問題トラッカーで参照されていることです: https://bugs.launchpad.net/beautifulsoup/+bug/1603299
html5lib v0.9999999
(7ナイン)で動作します
"html5lib<=0.9999999"
Beautifulsoup4とhtml5libをアップグレードし、問題を解決しました。
pip install --upgrade beautifulsoup4
pip install --upgrade html5lib
これは、アップストリームパッケージhtml5libの問題です。 https://bugs.launchpad.net/beautifulsoup/+bug/1603299 修正するには、強制的に古いバージョンにダウングレードします。
pip install --upgrade html5lib == 1.0b8
@Bhavukアンサーのhtml5lib 1.0b8へのダウングレードは機能しますが、漂白剤のバージョンの問題を解決します。
私にとっての解決策は、html5libの新しいバージョンと互換性があるように漂白剤のバージョンを変更することでした
pip install --upgrade bs4
pip install --upgrade bleach==1.4.2
pip install --upgrade html5lib==1.0b8
Pythonバージョン3.5
私にも同じ問題が発生しました。あなたが何をしようとしていたのかわかりませんが、pd.read_html()
を使用して、pandasでXMLファイルを読み取ろうとしたときに発生しました。
この問題は、beautifulsoup4、html5lib、およびlxmlのすべてを次のようにアップグレードすることで修正されます。
pip install bs4
pip install html5lib
pip install lxml
Python環境を再起動すると、現在は動作しています。
このコマンドは私のために問題を解決しました:
Sudo pip install html5lib==0.9999999