當我收到警告時,如何在無需安裝 tesseract 3.03 的情況下解決問題:
警告:您正在執行不支援的 Tesseract 版本。預計版本為 3.03,您的版本是: 3.02.02 開啟資料檔 /usr/local/share/tessdata/lus.traineddata 時發生錯誤 請確保 TESSDATA_PREFIX 環境變數設定為「tessdata」目錄的父目錄。載入語言“lus”失敗 Tesseract 無法載入任何語言!分段錯誤(核心轉儲)
答案1
檢查包是否安裝
dpkg -l | grep tesseract
安裝立方體使用包
sudo apt install tesseract-ocr
搜尋/安裝可用的相關軟體包
apt search tesseract | grep -B1 language
使用有效的ISO 639-2(三個字母)語言代碼。
tesseract image.png -l spa myoutput
會生成myoutput.txt
有關的
- 提高 OCR 之前的影像質量
- 新增文字到 PDF和
pdfsandwich -verbose -lang spa -layout single scanned.pdf
答案2
這是解決方案:
只要將檔案從 openalpr/runtime_data/ocr/tessdata 複製到 /usr/local/share/tessdata