Estoy intentando copiar texto de un PDF, pero obtengo basura

Question

El texto subyacente está confuso. Creo que @skub tiene razón al pensar que puede ser a propósito. Una forma de obtener el texto sería exportar cada página como una imagen (por ejemplo,.jpgo.png) y luego escanear las imágenes conLOCsoftware. Pude probar esto en Windows 7 con Adobe Acrobat X; funcionó.

Actualizar:

Si su visor de documentos tiene una función similar, copy with formattingcopie el texto como se esperaba. Profundizando, puedo confirmar que las fuentes incrustadastodotener uncodificación personalizada.

Answer 1

El texto subyacente está confuso. Creo que @skub tiene razón al pensar que puede ser a propósito. Una forma de obtener el texto sería exportar cada página como una imagen (por ejemplo,.jpgo.png) y luego escanear las imágenes conLOCsoftware. Pude probar esto en Windows 7 con Adobe Acrobat X; funcionó.

Actualizar:

Si su visor de documentos tiene una función similar, copy with formattingcopie el texto como se esperaba. Profundizando, puedo confirmar que las fuentes incrustadastodotener uncodificación personalizada.

Estoy intentando copiar texto de un PDF, pero obtengo basura

Respuesta1

Actualizar:

información relacionada