MS Word から生成された PDF はなぜこんなに大きいのでしょうか?

MS Word から生成された PDF はなぜこんなに大きいのでしょうか?

私は次の文だけを含む簡単な MS Word 文書を作成しました:

これは小さな文書です。

他には何もありません。次に、このドキュメントを DOCX と PDF として保存しました。ファイル サイズは次のとおりです。

DOCX:12 KB
PDF:89 KB

この違いは巨大な技術的に、そして主にテキスト文書が数十KBDOCXでPDFを生成し始めると、数百KB大きいです。PDF 形式の何がそんなに非効率的なのでしょうか? それとも、Word がひどい出力アルゴリズムを使用しているだけでしょうか?

ちなみに、PDF 出力設定は、可能な限り小さいファイルを作成するように設定されました。

PDF出力オプション

答え1

PDF を Notepad++ で開くと、次の内容が見つかります。

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

そして、そのオブジェクトは /FontFile2 命令の最後に参照されます。

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

Word 文書で使用されるフォントは PDF に埋め込まれるため、PDF は自己完結型になります。

私はこのスライドデッキPDF の指示を解読します。

PDFファイルにフォントが埋め込まれないようにしたい場合は、Word文書でPDFビューアで使用できる14の標準書体のいずれかを使用していることを確認してください(出典:ウィキペディア

  • Times New Roman > Times (v3) (通常、斜体、太字、太字斜体)
  • クーリエ 新着 > クーリエ (通常、斜体、太字、太字斜体)
  • Arial > Helvetica (v3) (通常、斜体、太字、太字斜体)
  • シンボル > シンボル
  • ウィングディンガー > ザップディンガー

答え2

Microsoft Word で簡単な原稿を PDF にエクスポートしようとしたときに、この現象が何度も発生しました。5~8 ページの Word 文書 (サイズは約 50 KB) が 10 MB を超える PDF ファイルになり、誰かに電子メールで送信するには大きすぎます。

ルネの答え正しい方向に進んでいます。問題はフォントが文書に埋め込まれることですが、標準の書体の 1 つを使用するだけでは必ずしも問題が解決されるわけではありません。

私の文書はすべてTimes New Romanで、太字と斜体以外の文字は使っていませんでした。少なくとも私はそう思っていました。しかし、自動フォントが字詰めデフォルトのテンプレートで有効になっています(明らかな理由)。PDF にエクスポートすると、Word は実際にこれらの合字をそれぞれ別のフォント オブジェクトとしてドキュメントに埋め込み、信じられないほどにドキュメントを肥大化させていました。

修正方法は簡単です。毎回実行することを忘れないようにするだけです。

  1. ドキュメント内のすべてのテキストを選択します。
  2. 書式 → フォント → 詳細設定
  3. 「フォントのカーニング」のチェックを外す

興味深いことに、合字、コンテキスト代替、その他の高度なタイポグラフィ機能を有効にしたままにしておくことができます。これらは、生成される PDF のサイズに目立った影響を与えません。

ドキュメントを PDF として再度エクスポートすると、サイズは 100 KB 程度に縮小されます。残念ながら、カーニングは標準以下なので、この方法で印刷することはお勧めしませんが、ドキュメントを電子メールで送信する場合は問題なく機能します。

答え3

あまり技術的でない答えが役に立つかもしれないとすれば、PDF はベクトル (つまり、数式) を使用して、表示されるすべてのものを記述するということです。すべての曲線と直線は数式によって定義されるため、特にドキュメントに画像がある場合は、保持する情報が多くなるはずです。

これの利点は、線や曲線に幅がないため、ズームに合わせて拡大縮小できるため、理論的には解像度や詳細を失うことなく、無限に拡大できることです。

Google の最近のフォント変更により、ロゴのサイズが約 14 KB から約 300 KB に縮小されたのと同様に、フォントをシンプルにするとファイル サイズを縮小できる可能性があります。

関連情報