我正在嘗試在 Ubuntu 20.04.1 LTS 中訓練 Tesseract。
對於訓練數據,我使用 jTessBoxEditor。
tesseract --psm 6 --oem 3 Liberation_serif.font.exp0.tif Liberation_serif.font.exp0 makebox
我收到以下錯誤:
Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.
我嘗試從 git 下載 eng.traineddata 並將其貼到 tessdata。我該如何解決這個問題?
編輯:我下載的 tesseract 可執行檔和 tesseract 原始碼位於不同的位置。
答案1
我在兩個位置下載了 tesseract cat >> .pam_environment
。
我再次登錄,現在可以製作 .box 檔案了。