我想要 tesseract 轉換資料夾中的所有檔案。我不想以任何方式合併文件,因為我在使用 hocr2pdf 和 pdfbeads 等程式一次合併多個文件時遇到問題。
我運行tesseract *.tif * hocr
並最終得到以下結果
read_params_file: parameter not found: II*
答案1
我嘗試過這個並且有效
for i in *.tif ; do tesseract $i outtext; done;
確保在終端機中並將目錄更改為所有檔案的位置
答案2
我稍微修改了 Meer Borg 的答案。使用該程式碼,我的輸出檔案僅包含資料夾中最後一個檔案的輸入。
使用 tesseract 的stdout
選項 with>>
是一種將所有輸出附加到單一檔案的方法:
for i in *.tif ; do tesseract $i stdout >> outtext; done;