Как использовать тессеракт?

Как использовать тессеракт?

Я хочу, чтобы tesseract конвертировал все файлы папки. Я не хочу объединять файлы каким-либо образом, так как у меня возникают проблемы с программами вроде hocr2pdf и pdfbeads, объединяющими более одного файла за раз.

Я бегу tesseract *.tif * hocrи получаю следующее

read_params_file: parameter not found: II*

решение1

Я попробовал это и это работает

for i in *.tif ; do tesseract $i outtext;  done;

Убедитесь, что когда вы находитесь в терминале, вы меняете каталог на местоположение всех файлов

решение2

Я немного изменил ответ Мира Борга. Используя этот код, мой выходной файл имел только входные данные из последнего файла в папке.

Использование опции tesseract stdoutwith >>— это способ добавить все выходные данные в один файл:

for i in *.tif ; do tesseract $i stdout >> outtext;  done;

Связанный контент