Archivos PDF de libros antiguos de la biblioteca... ¿Por qué el texto y el fondo parecen estar en capas separadas?

Question

Esto puede deberse a que se utiliza el software OCR para convertir imágenes en texto automáticamente. Esto sucede cuando escaneo páginas de libros de texto con mi escáner Xerox con capacidad OCR. A menudo, el texto del archivo PDF resultante ni siquiera puede ser preciso, tiene espacios adicionales o está en capas completamente diferentes.

Answer 1

Esto puede deberse a que se utiliza el software OCR para convertir imágenes en texto automáticamente. Esto sucede cuando escaneo páginas de libros de texto con mi escáner Xerox con capacidad OCR. A menudo, el texto del archivo PDF resultante ni siquiera puede ser preciso, tiene espacios adicionales o está en capas completamente diferentes.

Archivos PDF de libros antiguos de la biblioteca... ¿Por qué el texto y el fondo parecen estar en capas separadas?

Respuesta1

información relacionada