Копировать текст из отсканированного PDF-файла

Копировать текст из отсканированного PDF-файла

У меня есть несколько отсканированных документов, из которых я хочу скопировать текст.

Adobe Acrobat Pro распознает текст, однако он заключен в несколько ограничивающих рамок, что делает невозможным (?) просто выделить весь текст и скопировать его в другое место.

введите описание изображения здесь

Есть ли способ получить весь текст из документа, не щелкая по каждому из полей, либо заставив AAP игнорировать поля, либо написав скрипт, или что-то в этом роде?

Есть ли другое программное обеспечение, более подходящее для решения этой проблемы?

решение1

В зависимости от сканера вы можете использовать опцию «Сканировать как редактируемый текст». Мой сканер HP Printer предлагает эту опцию.

Или попробуйте программное обеспечение для оптического распознавания символов

Попробуйте Abbyy Fine Reader https://www.abbyy.com/en-ca/finereader/

Связанный контент