.box 파일을 만들 수 없습니다. -Tessearct 교육

.box 파일을 만들 수 없습니다. -Tessearct 교육

Ubuntu 20.04.1 LTS에서 Tesseract를 교육하려고 합니다. tesseract와 필요한 교육 도구를 다운로드했습니다.

훈련 데이터의 경우 jTessBoxEditor를 사용하고 있습니다. .tiff 파일이 있지만 .box 파일을 만들 수 없습니다. 터미널에 다음을 입력하면:

tesseract --psm 6 --oem 3 Liberation_serif.font.exp0.tif Liberation_serif.font.exp0 makebox

다음 오류가 발생합니다.

Please make sure the TESSDATA_PREFIX environment variable is set to your "tessdata" directory.
Failed loading language 'eng'
Tesseract couldn't load any languages!
Could not initialize tesseract.

git에서 eng.traineddata를 다운로드하여 tessdata에 붙여넣어 보았습니다. 그러나 동일한 오류 메시지가 나타납니다. 그런 다음 TESSDATA_PREFIX를 여러 번 변경하여 tessdata를 가리키도록 했지만 동일한 오류 메시지가 다시 나타납니다. 이 문제를 어떻게 해결합니까?

편집: 내가 다운로드한 tesseract 실행 파일과 tesseract 소스 코드는 다른 위치에 있습니다.

답변1

두 위치에 tesseract를 다운로드했습니다. TESSDATA_PREFIX가 가리키는 위치에는 eng.traineddata가 없습니다. github에서 해당 디렉토리에 다운로드하고 cat >> .pam_environmentTESSDATA_PREFIX가 해당 위치를 가리키도록 다시 사용했습니다.

다시 로그인했더니 이제 .box 파일을 만들 수 있게 되었습니다.

관련 정보