Estou tentando copiar texto de um PDF, mas recebo lixo

Question

O texto subjacente está distorcido. Acho que @skub está correto ao pensar que pode ser de propósito. Uma forma de obter o texto seria exportar cada página como uma imagem (por exemplo.jpgou.png) e, em seguida, digitalize as imagens comOCRProgramas. Consegui testar isso no Windows 7 com Adobe Acrobat X; funcionou.

Atualizar:

Se o seu visualizador de documentos tiver um recurso semelhante, copy with formattingcopie o texto conforme o esperado. Indo mais fundo, posso confirmar que as fontes incorporadastodostenha umcodificação personalizada.

Answer 1

O texto subjacente está distorcido. Acho que @skub está correto ao pensar que pode ser de propósito. Uma forma de obter o texto seria exportar cada página como uma imagem (por exemplo.jpgou.png) e, em seguida, digitalize as imagens comOCRProgramas. Consegui testar isso no Windows 7 com Adobe Acrobat X; funcionou.

Atualizar:

Se o seu visualizador de documentos tiver um recurso semelhante, copy with formattingcopie o texto conforme o esperado. Indo mais fundo, posso confirmar que as fontes incorporadastodostenha umcodificação personalizada.

Estou tentando copiar texto de um PDF, mas recebo lixo

Responder1

Atualizar:

informação relacionada