¿Por qué los archivos PDF generados a partir de MS Word son tan grandes?

¿Por qué los archivos PDF generados a partir de MS Word son tan grandes?

Creé un documento simple de MS Word que contiene solo esta oración:

Este es un pequeño documento.

Nada más. Luego guardé este documento como DOCX y PDF. Aquí están los tamaños de archivo:

DOCX:12 KB
PDF:89KB

Esta diferencia esenorme, técnicamente, y realmente empieza a molestarme cuando la mayoría de documentos textuales sondecenas de kBen DOCX comience a generar archivos PDF que seancientos de kBgrande. ¿Qué tiene de ineficiente el formato PDF? ¿O simplemente Word utiliza algún algoritmo de salida terrible?

Por cierto, la configuración de salida del PDF se configuró para crear el archivo más pequeño posible:

Opciones de salida de PDF

Respuesta1

Si abres el PDF en notepad++ encontrarás:

9 0 obj
<</Filter/FlateDecode/Length 79100/Length1 171804>>
stream
xœì}    XTGºvÕ9½/t7Ðl
..... many more bytes  ...   ëH|  
endstream
endobj
10 0 obj

y se hace referencia a ese objeto aquí al final de la instrucción /FontFile2:

6 0 obj
<</Type/FontDescriptor/FontName/ABCDEE+Calibri/Flags 32/ItalicAngle 0/Ascent 750/Descent -250/CapHeight 750/AvgWidth 521/MaxWidth 1743/FontWeight 400/XHeight 250/StemV 52/FontBBox[ -503 -250 1240 750] /FontFile2 9 0 R>>
endobj

Las fuentes utilizadas por el documento de Word se incrustan en el PDF, por lo que el PDF es autónomo.

solíaesta plataforma de diapositivaspara descifrar las instrucciones en PDF.

Si desea evitar que las fuentes se incrusten en el archivo PDF, asegúrese de que su documento de Word utilice uno de los 14 tipos de letra estándar disponibles en los visores de PDF (fuenteWikipedia)

  • Times New Roman > Times (v3) (en regular, cursiva, negrita y negrita cursiva)
  • Courier Nuevo > Courier (en regular, oblicuo, negrita y negrita oblicua)
  • Arial > Helvetica (v3) (en regular, oblicuo, negrita y negrita oblicua)
  • Símbolo > Símbolo
  • Wingdings > Zapf Dingbats

Respuesta2

Esto me ha sucedido muchas veces en Microsoft Word al intentar exportar un manuscrito simple a PDF. Un documento de Word de 5 a 8 páginas, de aproximadamente 50 KB de tamaño, terminará como un archivo PDF de más de 10 MB, que es demasiado grande para enviarlo razonablemente por correo electrónico a alguien.

la respuesta de renéestá en el camino correcto: el problema es que las fuentes se incrustan en el documento, pero el simple hecho de usar uno de los tipos de letra estándar no necesariamente resolverá el problema.

Todos mis documentos estaban en Times New Roman, sin utilizar nada más sofisticado que negrita y cursiva. O eso pensé. resulta que tengo automaticointerletradohabilitado en mi plantilla predeterminada (pararazones obvias). Al exportar a PDF, Word en realidad incrustaba cada una de esas ligaduras como un objeto de fuente separado en el documento, hinchándolo más allá de lo imaginable.

La solución es sencilla, sólo debes acordarte de hacerlo cada vez:

  1. Seleccione todo el texto del documento.
  2. Formato → Fuente → Avanzado
  3. Desmarque "Kerning para fuentes"

Curiosamente, puede dejar habilitadas las ligaduras, las alternativas contextuales y otras funciones tipográficas avanzadas; no tienen ningún efecto perceptible en el tamaño del PDF resultante.

Vuelva a exportar el documento como PDF y se reducirá a unos cien KB. Desafortunadamente, el interletraje es deficiente, por lo que no recomendaría imprimir de esta manera, pero funciona bien para enviar un documento por correo electrónico.

Respuesta3

Para dar una respuesta menos técnica que puede ayudar es que los PDF usan vectores (es decir, ecuaciones matemáticas) para describir todo lo que ves. Todas las curvas y líneas están definidas por ecuaciones matemáticas, por lo que necesariamente habrá mucha información que conservar, especialmente cuando tienes imágenes en tus documentos.

El beneficio de esto es que, en teoría, puedes acercarte infinitamente sin perder resolución ni detalle, porque las líneas y curvas no tienen ancho, por lo que pueden escalar con el zoom.

Así como el reciente cambio de fuente de Google redujo el tamaño del logotipo de ~14 KB a ~300 B, las fuentes más simples probablemente ayudarán a reducir el tamaño de su archivo.

información relacionada