
Recentemente converti um PDF para Microsoft Word e estou enfrentando um problema depois de alterar a margem e o tamanho do papel do arquivo convertido. Há uma marca de parágrafo no meio do diálogo. Aqui está o exemplo:
"Quando Fillmore estava morrendo, ele estava com muita fome. Mas seu médico estava tentando matar sua febre de fome ou algo assim.
Fillmore não parava de falar sobre querer comer, então finalmente o médico lhe deu uma pequena colher de chá de sopa.
E tudo sarcástico, Fillmore disse: 'A nutrição é saborosa' e depois morreu.
Este diálogo deveria estar no mesmo parágrafo, e há muitos problemas iguais no artigo convertido. Como faço para corrigir isso? (Espero poder consertar tudo de uma vez, o que economiza tempo.)
Responder1
Pelo que entendi sobre o problema acima, ele está relacionado ao processamento de OCR, e o OCR apenas converte o que entende e cria um documento, muitas vezes fazendo traduções erradas relacionadas aos caracteres que podem ser mal interpretados. Então, de qualquer forma, esta ainda não é uma ciência EXATA, pois os programas de OCR evoluíram muito bem, mas ainda não é 100% positivo quanto à sua interpretação. Sempre precisamos corrigir esses erros manualmente.
Responder2
Não creio que as estruturas dos parágrafos de um documento PDF sejam iguais às de qualquer programa de processamento de texto. É apenas o posicionamento do texto na planilha e os caracteres são representados como imagem impressa ou caractere associado, mas não acredito que realize a formatação de informações como Cor, Parágrafos e Próxima linha ou Inserir código.