Quando uso o OCR no Adobe Acrobat 2017, descobri que ele não está pegando o mesmo texto na mesma página. Por exemplo, quando temos a palavra Dr. Thandcerca de 15 vezes na mesma página, ele só aparece esse nome 12 vezes. Alguém pode fornecer orientação sobre esse assunto.
Responder1
O OCR nunca é 100% preciso e uma revisão editorial deve ser feita após o OCR de um PDF.
Pela minha experiência estimada (opinativa) com resultados de OCR:
- sem serifa: 95% preciso
- serifa: 90% precisa
- fonte monoespaçada: 80% precisa
- serifa decorativa: 75% de precisão
- cursiva: 50% precisa
É claro que as estimativas acima são válidas apenas se o PDF não tiver sido digitalizado e for apenas um PDF baseado em imagem sem lixo.
Se você não conseguir executar o PDF através do editorial, poderá sempre verificar a ortografia pressionando a F7tecla ou usarEdit => Check Spelling => In Fields, Comment, Editable Text