どうすればpdftotextを適切にインストールできますか?
Python 3.6にpdftotextをインストールすると、以下のエラーメッセージが表示されます。Zipファイルをダウンロードして手動でパッケージをインストールしようとしましたが、それでも同じエラーが発生しました。
pdftotext/pdftotext.cpp(4): fatal error C1083: Cannot open include file: 'poppler/cpp/poppler-document.h': No such file or directory
error: command 'C:\\Program Files (x86)\\Microsoft Visual Studio 14.0\\VC\\BIN\\x86_AMD64\\cl.exe' failed with exit status 2
PdftotextパッケージのReadme.mdファイルにいくつかのヘルプが見つかりました:
1)OS依存関係をインストールします。
debian、Ubuntu、および友人の場合:
Sudo apt-get update
Sudo apt-get install build-essential libpoppler-cpp-dev pkg-config python-dev
fedora、Red Hat、およびその仲間:
Sudo yum install gcc-c++ pkgconfig poppler-cpp-devel python-devel redhat-rpm-config
2)通常のインストールを実行します。
pip install pdftotext
そしてそれは私のために働いた。
以下のコマンドで問題が解決しました。
Sudo apt-get install libpoppler-cpp-dev
https://blog.droidzone.in/2018/05/01/install-pdftotext-python-extension-error/
Mac OSの場合:popplerをbrewでインストール
私は数日間Win10にpdftotextをインストールする方法を理解しようと努めてきました。インターネット検索で何も得られなかった。知っておく必要がある人のために、Anacondaを使用してWin10にpdftotextをインストールします。 YMMV。
Anaconda Pythonをインストールします。 Anacondaのインストールに関する記事はたくさんあるので、ここでは詳しく説明しません。
Pip install pdftotextを実行しようとすると、Microsoft Visual C++が必要であるというエラーが表示されます。
ブラウザーで http://visualstudio.Microsoft.com/downloads に移動します。 Tools for Visual Studio 2019タブで、Build Tools for Visual Studio 2019をダウンロードします。次に、C++ビルドツールオプションボックスをオンにして[Install]をクリックし、ツールをインストールします。
これで、pipインストールを取得してVC++エラーを通過するはずです。残念ながら、「インクルードファイルを開けません:「poppler/cpp/poppler-document.h」というエラーが表示されます。これはpopplerライブラリがないためです。
インターネットに戻ってください! Windowsにはpopplerが必要です。この記事の執筆時点では、最適なオプションは http://blog.alivate.com.au/poppler-windows です。最新のバイナリを入手して解凍します。エラーを確認すると、pipは{Anaconda3ディレクトリ}\include\poppler\cpp\poppler-document.hでヘッダーファイルを探しています。解凍したアーカイブを確認してください。 includeフォルダーにpopplerディレクトリーが表示されます。そこのcppディレクトリに移動すると、poppler-document.hファイルが見つかります。
Popplerディレクトリ全体をAnaconda3\includeフォルダーにコピーしたので、それを行います。
もう一度pip installを実行しようとすると、依然として大量のエラーが発生します!ただし、これらは以前に表示されたエラーではなく、このエラーは欠落しているリンクライブラリpoppler-cpp.libを探しています。別のマシンにインストールされているCondaを検索すると、popplerパッケージにこのファイルが見つかりました。そう
conda install -c conda-forge poppler
これでpoppler-cpp.libファイルがインストールされます。次に、ファイルをホームから{Anaconda3ディレクトリ}\Library\lib\poppler-cpp.libにコピーし、pdftotextが予期する場所に貼り付けます({Anaconda3ディレクトリ}\libs)。
もう一度pdftotextをpip installすると、そこにあります!誰かがこれを少し洗練する方法を見つけると確信していますが、今のところ、Win10に動作するpdftotext Pythonライブラリがあります。
これらの指示は、スクリーンショットとともに、私のブログにあります https://coder.haus/2019/09/27/installing-pdftotext-through-pip-on-windows-10/
Windowsのシンプルなソリューション:
\poppler-0.68.0\bin
環境変数のパス。それでおしまい。環境を再起動します(例:jupyter Notebook、vscodeなど)。
Ubuntuユーザーの場合
Sudo apt-get install libpoppler58=0.41.0-0ubuntu1 libpoppler-dev libpoppler-cpp-dev
私のために働いた