web-dev-qa-db-ja.com

コマンドラインからPDFファイルで検索して置換

PDFファイルから特定のテキストまたはWordを見つけて別のテキストに置き換え、コマンドラインから新しいPDFファイルを作成したい。テキストファイルでsedfindawkシリーズを試しましたが、PDFファイルを取得したいです。どのコマンドラインユーティリティが役立ちますか?

7
denny

pdftkを使用してファイルを解凍し、sedを使用して編集し、最後に再圧縮します。

pdftk input.pdf output uncompressed.pdf uncompress
sed -i 's/foo/bar/g' uncompressed.pdf
# uncompressed.pdf now has all the changes
pdftk uncompressed.pdf output changed.pdf compress

もちろん、画像内のテキストをこのように変更することはできません。

12
Fiximan

可能な解決策は次のようになります...

poppler-utilsパッケージのいくつかのツールを使用して、pdfファイルを純粋なテキストファイルに変換できます。

次の方法でインストールできます。

Sudo apt-get install poppler-utils

PDFファイルをテキストファイルに変換する

pdftotext /home/USER/Desktop/test.pdf /home/USER/Desktop/test.txt

これで、pdfファイルで編集と置換を行うことができます。

その後、cups-pdf OR text2pdfと呼ばれるパッケージを使用して、元に戻すことができます。

完全な解決策ではないかもしれませんが、その作業を行う必要があります。

お役に立てれば!

0
teufelsfrucht