При использовании OCR с помощью Adobe Acrobat 2017 один и тот же текст на одной странице не распознается несколько раз

Question

Распознавание текста никогда не бывает точным на 100%, поэтому после распознавания текста PDF-файла необходимо провести его редакционную проверку.

Из моего опыта оценки (мнения) результатов OCR:

без засечек: точность 95%
засечки: точность 90%
Моноширинный шрифт: точность 80%
декоративная засечка: точность 75%
курсив: точность 50%

Конечно, приведенные выше оценки действительны только в том случае, если PDF-файл не был отсканирован и представляет собой просто PDF-файл на основе изображения без мусора.

Если вы не можете запустить PDF-файл через редакторскую проверку, вы всегда можете проверить орфографию, нажав клавишу F7или используяEdit => Check Spelling => In Fields, Comment, Editable Text

Answer 1

Распознавание текста никогда не бывает точным на 100%, поэтому после распознавания текста PDF-файла необходимо провести его редакционную проверку.

Из моего опыта оценки (мнения) результатов OCR:

без засечек: точность 95%
засечки: точность 90%
Моноширинный шрифт: точность 80%
декоративная засечка: точность 75%
курсив: точность 50%

Конечно, приведенные выше оценки действительны только в том случае, если PDF-файл не был отсканирован и представляет собой просто PDF-файл на основе изображения без мусора.

Если вы не можете запустить PDF-файл через редакторскую проверку, вы всегда можете проверить орфографию, нажав клавишу F7или используяEdit => Check Spelling => In Fields, Comment, Editable Text

При использовании OCR с помощью Adobe Acrobat 2017 один и тот же текст на одной странице не распознается несколько раз

решение1

Связанный контент