tesseract を使用してフォルダー内のすべてのファイルを変換します。hocr2pdf や pdfbeads などのプログラムでは一度に複数のファイルを結合するのに問題があるため、ファイルを結合したくありません。
実行してみるtesseract *.tif * hocr
と次のようになります
read_params_file: parameter not found: II*
答え1
これを試してみたらうまくいきました
for i in *.tif ; do tesseract $i outtext; done;
ターミナルでディレクトリをすべてのファイルの場所に変更することを確認してください
答え2
Meer Borg の回答を少し変更しました。そのコードを使用すると、出力ファイルにはフォルダー内の最後のファイルからの入力のみが含まれます。
tesseract のstdout
オプションを使用すると、>>
すべての出力を 1 つのファイルに追加することができます。
for i in *.tif ; do tesseract $i stdout >> outtext; done;