私はたくさんのpdfでpdftotextを実行しています、そしてそれらのいくつかはこのエラーを投げます:
Error: Illegal entry in bfchar block in ToUnicode CMap
アウトファイルを調べたところ、問題ないように見えたので、重大なエラーかどうかはわかりませんが、心配しています。このエラーが何であるか、何が原因で、どの程度の損傷があるかを誰かが知っていますか?
文字を同等のUnicodeに変換するのに問題があるようです。損傷はほとんどまたはまったく発生しないと思います。おそらく、ASCIIエンコードされたPDFのみが原因です。