web-dev-qa-db-ja.com

MS Wordから生成されたPDFが非常に大きいのはなぜですか?

この文だけを含む簡単なMS Wordドキュメントを作成しました。

これは小さな文書です。

他には何もありません。次に、このドキュメントをDOCXおよびPDFとして保存しました。ファイルサイズは次のとおりです。

DOCX:12 kB
PDF:89 kB

この違いは、技術的にはhugeであり、数十kBDOCXでは、数百kB大きいPDFの生成を開始します。 PDF形式)についてそれほど非効率なのは何ですか?それともWordがひどい出力アルゴリズムを使用しているだけですか?

ところで、PDF出力設定は、可能な限り最小のファイルを作成するように設定されています:

PDF output options

70
Borek Bernard

PDFをNotepad ++で開くと、次のことがわかります。

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

そのオブジェクトは、/ FontFile2命令の最後でここで参照されます。

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

Word文書で使用されるフォントはPDFに埋め込まれるため、PDFは自己完結型です。

私は このスライドデッキ を使用してPDFの説明を解読しました。

PDFファイルにフォントが埋め込まれないようにしたい場合は、Word文書がPDFビューアで利用可能な14の標準書体の1つを使用していることを確認してください。 (ソース Wikipedia

  • Times New Roman> Times(v3)(通常、イタリック、ボールド、ボールドイタリック)
  • クーリエ新規>クーリエ(通常、斜体、太字、太字斜体)
  • Arial> Helvetica(v3)(通常、斜め、太字、太字の斜め)
  • シンボル>シンボル
  • ウイング> Zapf Dingbats
104
rene

これは、Microsoft Wordで簡単な原稿をPDFにエクスポートしようとしたときに何度も起こりました。サイズが50 KB以下の5〜8ページのWord文書は、最終的には10 MB以上のファイルになりますPDFファイルが大きすぎて、誰かに電子メールで送信するには適度に大きくなります。

ルネの答え は正しい方向に進んでいます。問題は、フォントがドキュメントに埋め込まれることです。しかし、標準の書体の1つを使用するだけでは、必ずしも問題が解決するわけではありません。

私の文書はすべて、タイムズニューローマンで書かれており、太字や斜体以外の空想を使っていません。かと思った。デフォルトのテンプレートで自動カーニングが有効になっていることがわかります( 明らかな理由 )。 PDFにエクスポートするとき、Wordは実際にそれらの合字のそれぞれを個別のフォントオブジェクトとしてドキュメントに埋め込み、信じられないほど膨らませていました。

修正は簡単で、毎回それを行うことを覚えておかなければなりません:

  1. ドキュメント内のすべてのテキストを選択します。
  2. 書式→フォント→詳細
  3. 「フォントのカーニング」のチェックを外します

興味深いことに、合字、文脈依存の代替、およびその他の高度なタイポグラフィ機能を有効にしておくことができます。結果のPDFのサイズに目に見える影響はありません。

ドキュメントをPDFとして再エクスポートすると、100 KB程度になります。残念ながら、カーニングは標準以下なので、この方法で印刷することはお勧めしませんが、ドキュメントを電子メールで送信する場合は問題なく機能します。

3
Cody Gray