web-dev-qa-db-ja.com

生成されたLaTeXの変換PDF AcrobatXIを使用したWordへの変換

繰り返しになりますが、LaTeXとMicrosoftWordの両方の土地に住む必要があることに気づきました。私はAcrobatXIを利用できるので、LaTeXからWordへの変換の仲介者として使用するだけだと思いました。過去にこの作品を制作したことがあるようですが、今では意味不明なテキストがたくさん出てきています。

現在のワークフロー:

  • TeXworksでLaTeXを書く(MikTeXから)
  • 「pdfLaTeX + MakeIndex + BibTex」設定を使用したタイプセット
  • 出力を開くPDF Acrobat ProXIで
  • [ファイル]-> [その他として保存]-> [Microsoft Word]-> [Word文書]に移動します
  • 設定で、[コメントを含める]と[必要に応じてOCRを実行する]のチェックを外します
  • セーブ

すべてうまくいったようです。出力されたWord文書を開くと、すべてのテキストがランダムな記号になっています。興味深いことに、フォーマットは完全に完璧に見えます-リストはリストであり、リンクは引き続き機能し、ページレイアウトは正常に見えます-テキストが読めないだけです。確認したところ、AcrobatはPDFを検索でき、テキストをWordに(クリップボード経由で)単純にコピーしても問題ありません。ただし、[書式設定でコピー]を選択してWordに貼り付けると、シンボルに戻ります。

これは単なるフォントの問題だと思います。また、これはかなり一般的な問題であり、必ずしもAcrobatに固有のものではないと思います。私はこれを整理することを本当に望んでいます-出力Word文書は完全である必要はなく、同じテキストとほぼ同じフォーマットである必要があります。 PDF Acrobatがより簡単に使用できるようになる可能性があるMikTeXで変更可能な設定についての考えはありますか?

ありがとう!

5
Jacob Schaer

ラテックスドキュメントで使用してこの問題を解決しました

\usepackage[T1]{fontenc}
\usepackage{lmodern}

最初のステートメントはT1フォントエンコーディングを有効にし、2番目のステートメントは最新のラテックスフォントの使用を有効にします。

私は最初のステートメントをずっと使用していましたが(それ自体ではこの問題は修正されませんでした)、2番目のステートメントを追加すると修正され、Acrobat Pro(私の場合はX)から保存されたWord文書が正しく表示されました。

詳細については、この質問の回答を参照してください https://tex.stackexchange.com/questions/115080/cannot-copy-text-from-the-simplest-pdf-file?rq=1 質問。

1
sceee
  1. これらのパッケージをLateXファイルで使用すると、より適切なテキストコピー可能なPDFファイルの作成に役立つ可能性があります。

    • \ usepackage [T1] {fontenc}
    • \ usepackage {lmodern}
  2. PDFファイルを生成します

  3. PDFファイルをMicrosoftWord 2013以降で開く

  4. それはあなたのすべてのテキスト、図、表を変換します。しかし、ページの上部/下部にある脚注、本の名前、著者名のセクションで問題が発生しました。

0
Abu Sayed