
Cada vez que imprimo imágenes escaneadas (como JPG o PNG) en PDF, el texto se pixela, mientras que la imagen de origen no. No importa qué escritor de PDF utilice. No tengo Adobe, pero probé otros 5 o 6 con el mismo resultado.
Puedo volver a convertir estos PDF en imágenes con varias herramientas en línea y luego la resolución completa seguirá presente en esa imagen. Tampoco es un problema específico del visor de PDF.
¿Cuál es la razón para esto? ¿No es posible mostrar una imagen sin pérdidas en un PDF?
Sé que existen ajustes de calidad durante la impresión y ajustes de DPI, pero no influyen en la pixelación del texto.
Respuesta1
La razón del resultado de baja calidad de sus archivos PDF es su falta de comprensión de la diferencia entre imágenes vectoriales e imágenes de mapa de bits en combinación con las partes internas del formato de archivo PDF. Esto da como resultado un proceso de producción inadecuado que no produce el resultado esperado.
Mapa de bits versus fuentes vectoriales
La historia de la informática comenzó en un mundo de mapas de bits. Los caracteres se representaban mediante mapas de bits, también llamados "mapas ráster". Vea la siguiente fuente de mapa de bits Atari:
https://fontmeme.com/fonts/atari-font/
Los avances técnicos en términos de potencia de cálculo y almacenamiento permitieron una representación más bella de los caracteres mediante las llamadas fuentes vectoriales, que, por ejemplo, describen la letra "d" aproximadamente como un círculo tocado por una línea recta.
Las fuentes vectoriales se pueden ampliar al tamaño del universo sin pérdida de calidad. La fuente de mapa de bits, independientemente de la cantidad de recursos que consuman, se puede escalar a un nivel en el que se vean los píxeles cuadrados.
Formatos de archivos Adobe PDF internos
El formato de archivo PDF permite mezclar diferentes tipos de objetos, por ejemplo, imágenes de mapa de bits utilizando diferentes tipos de compresiones pero también fuentes vectoriales.
Los esquemas de compresión de pérdidas no son adecuados para texto.
Los esquemas de compresión como JPEG o JPEG2000, cuyos algoritmos se implementan en el formato de archivo PDF, no son adecuados para texto porque su típico modo de aplicación con pérdida crea artefactos de compresión que son fácilmente visibles.
Proceso de producción de PDF inadecuado: impresión en una impresora PDF virtual
Lo más probable es que su fuente se descomprima al imprimir, proporcionando un mapa de bits gigante a la impresora que recomprime este mapa de bits sin pérdidas utilizando un esquema de compresión que es bueno para la imagen pero inadecuado para el texto.
Es posible que no vea esta pérdida de calidad en la imagen escaneada, pero sí la ve al mirar el texto.
Solución 1
Pruebe la sugerencia de Daniel B. aumentando la calidad del escaneo, imprímalo en alta resolución y asegurándose de que la configuración de la impresora no comprima demasiado esa imagen.
Solución 2
La otra forma es utilizar un editor de PDF en el que incluya la imagen como JPEG con pérdida y el texto como un archivo PNG. De esta manera, su editor puede guardar ambos elementos (texto e imagen) por separado dentro del archivo PDF y no utiliza un solo mapa de bits como la impresora PDF.
Luego, su archivo PDF será decodificado por dos motores: DCDDecode para la imagen y JBIG2Decode para el texto; consulte la sección "imágenes rasterizadas" en el artículo. https://en.wikipedia.org/wiki/PDF
Solución 3
Si esto no cumple con sus expectativas, deberá escanear el texto por separado con la resolución óptica más alta disponible para usted. Luego necesitaría hacer OCR y dejar que algún programa adivine el tipo de fuente original. Si es necesario, deberá corregir manualmente el tipo de fuente.
Tenga en cuenta el proceso de producción de su escaneo: hay una imagen de mapa de bits de alta calidad y una fuente vectorial utilizada por el editor. Durante el proceso de impresión, el texto se transforma en un mapa de bits de alta calidad utilizando información vectorial. Supongo que puede llegar a 2540 ppp.
Es posible que su equipo de escaneo, comparativamente deficiente, solo pueda proporcionar ópticamente una cifra de 600 ppp, lo que ya refleja una pérdida de aproximadamente el 50% tanto en el eje x como en el eje y.
¡Espero que eso arroje algo de luz sobre tu problema!
Respuesta2
Puede ver algo similar en su elección de visor de imágenes. Basado en su modo actual. Misma imagen en 2 modos, la izquierda es como visor, la otra a la derecha es como editor y la mayoría de los "lectores" de PDF son editores.
IrfanView tiene varias configuraciones para PDF o imágenes. Aquí la imagen PDF se ve como si estuviera perfectamente escaneada (no importa si tiene o tiene pérdida). Visto en un visor de PDF, y el mismo PDF abierto en IrfanView se degradará a píxeles más grandes (primero tendrá Anti-Aliased pero luego se usará el Alias para ver PDF).
Visto como imagen se suavizará.
Un PDF tiene que definir cada forma de píxel de una forma u otra en una cuadrícula. Podría ser una cuadrícula sesgada y hay ejemplos extraños. Pero considere que la mayoría del 99%+ serán rectángulos regulares. Aquí hay 3 píxeles de ancho por 3 píxeles de alto en la visualización de PDF (imagen) de Google.
Deberías ver el zoom acercado o alejado exactamente igual. Dado que un PDF debe poder mostrar códigos QR y otros objetos basados en píxeles sin ningún suavizado mejorado. Los visores de imágenes tienen un paradigma diferente, ya que necesitan interpolar y suavizar imágenes. Lo que no puede ver a menos que sea una imagen es que hay 2 píxeles de ESQUINAS NEGRAS y solo un cuadrado blanco entre ellos.
Acróbata nosiempremantenga la pureza del color para que esos colores puedan cambiar pero no la forma (a menos que se lo indiquen). Vemos la imagen del mismo PDF, ¡en ese perfil de color RGB tiene las dos esquinas negras!
Una ventaja es que los píxeles individuales se pueden rotar y estirar desproporcionadamente (estos SON los mismos que los píxeles individuales cuadrados). Los gráficos no tienen resolución, simplemente vectores. La imagen para guardar como es de 3x3. Los he colocado como si estuvieran sobre un fondo blanco de 5x5. Así podemos ver que 2 cuadrados son negros. Entonces el archivo se guardará incorrectamente como 96 DPI, ya que en el pdf tenía 3 PPI diferentes, mucho más bajos.
Los espectadores de imágenes promediarán el píxel mediante reglas de anticipación para que se vea un degradado que suaviza los bordes ásperos. Observe que la esquina inferior izquierda se muestra correctamente como más negra.
Más notorio en diferentes ofertas EXACTAMENTE LA MISMA Imagen en el MISMO visor,
como imagen a la izquierda y como PDF a la derecha.