特定の単語を検索できるdjvuファイルがあります。ただし、PDFに変換すると( cutePDF およびオンライン djvu-pdf ツールで試しました)、単語を検索する可能性が失われているようです。
DjvuファイルをWordの検索可能性を維持したPDFに変換するにはどうすればよいですか?
私は これを行うためのスクリプト ずっと前に書いた。それは本質的に、重労働を行ういくつかのユーティリティの周りのグルーコードです。当時の私のスクリプトと他のツールの違いは、次のすべてを実行したのは私のスクリプトだけだったということです。
そうは言っても、それは非常に原始的です。私はそれが自分のすべてのファイルでうまく機能することを確認し、それ以来機能していません。
PDFファイルを PDF-XChange Viewer で開き、OCRを実行します(4つの言語のみがサポートされていると思います)。時間がかかりますが、非常に優れています(2つでも) -列ドキュメント)。
MacとLinuxでは Wine が必要です。
これ DjVuからPDFコンバーター は、元のDjVuが検索可能である場合に備えて、Wordの検索可能性を確実に維持します。また、calibreよりも小さい出力ファイルを生成します。
Calibre を試しましたか? Calibreの寄稿者は、djvuでOCRされたテキストがサポートされていると述べています 。したがって、検索可能なテキストでPDFに変換される可能性があります。