Puede ver/leer un contenido en PDF pero no puede extraer texto

Puede ver/leer un contenido en PDF pero no puede extraer texto

Descargué un archivo PDF que puedo ver, imprimir, modificar... pero no puedo hacer una simple copia de texto. Tras una breve búsqueda no pude encontrar cómo se logró esto. Lo intenté con la aplicación de vista previa de macOS y el visor de PDF de Chrome. En la aplicación de vista previa obtengo ?y en Chrome obtengo un espacio vacío

En la imagen a continuación puedes ver 8, pero cuando intento copiarlo obtengo un espacio vacío o ?creo que es la forma de macOS de decir que no puede leer esa codificación.

ingrese la descripción de la imagen aquí

Respuesta1

Esta es una restricción (efecto secundario) al hacer un pdf a partir de un .jpg.

No hay forma posible de solucionar este problema, excepto extraer el texto con el software OCR. Si no funciona directamente desde el pdf, imprimalo en formato .jpg y utilícelo.

Respuesta2

Puede utilizar esta herramienta para convertir PDF a texto:pdf2text-ocr

Luego podrás copiar, buscar, etc. Los archivos se convierten localmente en el navegador usandoLOCy nunca se cargan en servidores externos. Es gratuito y de código abierto.

Divulgación:Soy el autor de pdf2text-ocr. Lo creé para ayudar a un amigo que tenía el mismo problema en el trabajo.

información relacionada