OCR, который выводит данные о вероятности

2024-4-11 • tag-icon

OCR, который выводит данные о вероятности

Я хотел бы преобразовать печатные книги, которыми я владею, в аудио, отсканировав их с помощью OCR, а затем пропустив текст через TTS-движок. Эти книги не доступны в виде электронных книг.

Поскольку OCR может делать небольшие ошибки, особенно при конвертации изображений, содержащих старые шрифты, я хотел бы найти OCR-движок, который может помечать каждую область текста метаданными, описывающими предполагаемую вероятность правильного совпадения движком, или массив других возможностей. Например, см. транскрипцию голосовой почты Google Voice, которая выделяет каждое слово оттенками серого, указывающими рейтинг вероятности движка преобразования речи в текст.

Знаете ли вы какие-либо пакеты, предлагающие это?

Связанный контент