web-dev-qa-db-ja.com

djvuをWordの検索性を維持したPDFに変換するにはどうすればよいですか?

特定の単語を検索できるdjvuファイルがあります。ただし、PDFに変換すると( cutePDF およびオンライン djvu-pdf ツールで試しました)、単語を検索する可能性が失われているようです。

DjvuファイルをWordの検索可能性を維持したPDFに変換するにはどうすればよいですか?

6
glS

私は これを行うためのスクリプト ずっと前に書いた。それは本質的に、重労働を行ういくつかのユーティリティの周りのグルーコードです。当時の私のスクリプトと他のツールの違いは、次のすべてを実行したのは私のスクリプトだけだったということです。

  • 元のDjVuファイルと同様の圧縮率でした(10〜20倍のサイズではなく1.5〜2倍のサイズ)
  • 保存されたブックマーク/目次メタデータ(PDFリーダーでのナビゲーション用)
  • 検索用に埋め込まれたテキストレイヤーを保持

そうは言っても、それは非常に原始的です。私はそれが自分のすべてのファイルでうまく機能することを確認し、それ以来機能していません。

2
vindvaki

PDFファイルを PDF-XChange Viewer で開き、OCRを実行します(4つの言語のみがサポートされていると思います)。時間がかかりますが、非常に優れています(2つでも) -列ドキュメント)。

MacとLinuxでは Wine が必要です。

2
Marduk

これ DjVuからPDFコンバーター は、元のDjVuが検索可能である場合に備えて、Wordの検索可能性を確実に維持します。また、calibreよりも小さい出力ファイルを生成します。

1
Marc Aurel

Calibre を試しましたか? Calibreの寄稿者は、djvuでOCRされたテキストがサポートされていると述べています 。したがって、検索可能なテキストでPDFに変換される可能性があります。

0
beatcracker