Quero que o tesseract converta todos os arquivos de uma pasta. Não quero mesclar os arquivos de forma alguma, pois estou tendo problemas com programas como hocr2pdf e pdfbeads mesclando mais de um arquivo por vez.
Eu corro tesseract *.tif * hocr
e acabo com o seguinte
read_params_file: parameter not found: II*
Responder1
Eu tentei isso e funciona
for i in *.tif ; do tesseract $i outtext; done;
Certifique-se de estar no terminal e mudar o diretório para o local de todos os arquivos
Responder2
Modifiquei ligeiramente a resposta de Meer Borg. Usando esse código, meu arquivo de saída só teve entrada do último arquivo da pasta.
stdout
Usar a opção do tesseract >>
é uma maneira de obter toda a saída anexada a um único arquivo:
for i in *.tif ; do tesseract $i stdout >> outtext; done;