Warum sind aus MS Word generierte PDFs so groß?

Warum sind aus MS Word generierte PDFs so groß?

Ich habe ein einfaches MS Word-Dokument erstellt, das nur diesen Satz enthält:

Dies ist ein kleines Dokument.

Sonst nichts. Dann habe ich dieses Dokument als DOCX und als PDF gespeichert. Hier sind die Dateigrößen:

DOCX:12 kB
PDF:89 kB

Dieser Unterschied istriesig, technisch gesehen, und es beginnt mich wirklich zu stören, wenn überwiegend Textdokumente, dieDutzende von kBin DOCX beginnen mit der Generierung von PDFs, dieHunderte von kBgroß. Was ist so ineffizient am PDF-Format? Oder verwendet Word einfach einen schrecklichen Ausgabealgorithmus?

Übrigens wurden die PDF-Ausgabeeinstellungen so eingestellt, dass die kleinstmögliche Datei erstellt wird:

PDF-Ausgabeoptionen

Antwort1

Wenn Sie das PDF in Notepad++ öffnen, finden Sie:

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

und auf dieses Objekt wird hier am Ende in der /FontFile2-Anweisung verwiesen:

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

Die im Word-Dokument verwendeten Schriftarten werden in das PDF eingebettet, sodass das PDF in sich geschlossen ist.

ich benutztediese Foliensammlungum die PDF-Anweisungen zu entschlüsseln.

Wenn Sie verhindern möchten, dass die Schriftarten in die PDF-Datei eingebettet werden, stellen Sie sicher, dass Ihr Word-Dokument eine der 14 Standardschriftarten verwendet, die in PDF-Viewern verfügbar sind (QuelleWikipedia)

  • Times New Roman > Times (v3) (in normaler Schrift, kursiv, fett und fett kursiv)
  • Courier New > Courier (in Normal-, Schräg-, Fett- und Fett-Schrägschrift)
  • Arial > Helvetica (v3) (in normal, schräg, fett und fett schräg)
  • Symbol > Symbol
  • Wingdings > Zapf Dingbats

Antwort2

Das ist mir in Microsoft Word schon oft passiert, wenn ich versucht habe, ein einfaches Manuskript als PDF zu exportieren. Ein 5–8-seitiges Word-Dokument mit einer Größe von ca. 50 KB wird als PDF-Datei mit über 10 MB angezeigt, was viel zu groß ist, um es vernünftigerweise per E-Mail zu versenden.

Renes Antwortist auf dem richtigen Weg – das Problem besteht darin, dass Schriftarten in das Dokument eingebettet werden – aber die Verwendung einer der Standardschriftarten löst das Problem nicht unbedingt.

Alle meine Dokumente waren in Times New Roman und verwendeten nichts Ausgefalleneres als Fett- und Kursivschrift. Das dachte ich zumindest. Es stellte sich heraus, dass ich automatischKerningin meiner Standardvorlage aktiviert (füroffensichtliche Gründe). Beim Exportieren ins PDF-Format hat Word jede dieser Ligaturen tatsächlich als separates Schriftobjekt in das Dokument eingebettet, was es unglaublich aufgebläht hat.

Die Lösung ist einfach. Sie müssen lediglich jedes Mal daran denken, es zu tun:

  1. Wählen Sie den gesamten Text im Dokument aus.
  2. Format → Schriftart → Erweitert
  3. Deaktivieren Sie „Kerning für Schriftarten“

Interessanterweise können Sie Ligaturen, kontextbezogene Alternativen und andere erweiterte typografische Funktionen aktiviert lassen. Sie haben keinen wahrnehmbaren Einfluss auf die Größe der resultierenden PDF-Datei.

Exportieren Sie das Dokument erneut als PDF, und es ist auf etwa hundert KB geschrumpft. Leider ist der Kerning unterdurchschnittlich, daher würde ich das Drucken auf diese Weise nicht empfehlen, aber zum Versenden eines Dokuments per E-Mail funktioniert es gut.

Antwort3

Eine weniger technische Antwort, die hilfreich sein könnte, ist, dass PDFs Vektoren (also mathematische Gleichungen) verwenden, um alles zu beschreiben, was Sie sehen. Alle Kurven und Linien werden durch mathematische Gleichungen definiert, und daher müssen zwangsläufig viele Informationen gespeichert werden, insbesondere wenn Ihre Dokumente Bilder enthalten.

Der Vorteil hiervon besteht darin, dass Sie theoretisch unendlich weit hineinzoomen können, ohne dass Auflösung oder Details verloren gehen, da die Linien und Kurven keine Breite haben und sich daher beim Zoomen anpassen können.

So wie Googles jüngste Schriftartänderung die Größe des Logos von ca. 14 KB auf ca. 300 B reduziert hat, tragen einfachere Schriftarten wahrscheinlich dazu bei, die Dateigröße zu verringern.

verwandte Informationen