Quiero que tesseract convierta todos los archivos de una carpeta. No quiero fusionar los archivos de ninguna manera porque tengo problemas con programas como hocr2pdf y pdfbeads que fusionan más de un archivo a la vez.
corro tesseract *.tif * hocr
y termino con lo siguiente
read_params_file: parameter not found: II*
Respuesta1
Probé esto y funciona.
for i in *.tif ; do tesseract $i outtext; done;
Asegúrese de que cuando esté en la terminal cambie el directorio a la ubicación de todos los archivos
Respuesta2
Modifiqué ligeramente la respuesta de Meer Borg. Usando ese código, mi archivo de salida solo tenía entradas del último archivo de la carpeta.
stdout
Usar la opción de tesseract >>
es una forma de agregar toda la salida a un solo archivo:
for i in *.tif ; do tesseract $i stdout >> outtext; done;