PDFファイルから特定のテキストまたはWordを見つけて別のテキストに置き換え、コマンドラインから新しいPDFファイルを作成したい。テキストファイルでsed
、find
、awk
シリーズを試しましたが、PDFファイルを取得したいです。どのコマンドラインユーティリティが役立ちますか?
pdftk
を使用してファイルを解凍し、sed
を使用して編集し、最後に再圧縮します。
pdftk input.pdf output uncompressed.pdf uncompress
sed -i 's/foo/bar/g' uncompressed.pdf
# uncompressed.pdf now has all the changes
pdftk uncompressed.pdf output changed.pdf compress
もちろん、画像内のテキストをこのように変更することはできません。
可能な解決策は次のようになります...
poppler-utilsパッケージのいくつかのツールを使用して、pdfファイルを純粋なテキストファイルに変換できます。
次の方法でインストールできます。
Sudo apt-get install poppler-utils
PDFファイルをテキストファイルに変換する
pdftotext /home/USER/Desktop/test.pdf /home/USER/Desktop/test.txt
これで、pdfファイルで編集と置換を行うことができます。
その後、cups-pdf OR text2pdfと呼ばれるパッケージを使用して、元に戻すことができます。
完全な解決策ではないかもしれませんが、その作業を行う必要があります。
お役に立てれば!