Я хочу, чтобы tesseract конвертировал все файлы папки. Я не хочу объединять файлы каким-либо образом, так как у меня возникают проблемы с программами вроде hocr2pdf и pdfbeads, объединяющими более одного файла за раз.
Я бегу tesseract *.tif * hocr
и получаю следующее
read_params_file: parameter not found: II*
решение1
Я попробовал это и это работает
for i in *.tif ; do tesseract $i outtext; done;
Убедитесь, что когда вы находитесь в терминале, вы меняете каталог на местоположение всех файлов
решение2
Я немного изменил ответ Мира Борга. Используя этот код, мой выходной файл имел только входные данные из последнего файла в папке.
Использование опции tesseract stdout
with >>
— это способ добавить все выходные данные в один файл:
for i in *.tif ; do tesseract $i stdout >> outtext; done;