JPEG에서 텍스트를 감지하려고 하면 텍스트와 이미지가 의심되는 모든 영역이 올바르게 표시되지만 ODT로 내보내면 빈 텍스트와 이미지 프레임이 있는 ODT만 생성됩니다.
어떻게든 구성해야 합니까 tesseract
?
(저는 우분투 14.10 32비트를 사용하고 있습니다)
답변1
이 시도:
ocrfeeder 프로그램을 엽니다.
엔진 편집: 클릭 Tools
-OCR Engine
을 선택 Tesseract engine
하고 클릭하세요.Edit
arguments engine
이에 대한 스크립트가 변경되었다고 말하는 곳은 다음과 같습니다.
$IMAGE $FILE -l eng -psm 3 > /dev/null 2> /dev/null; cat $FILE.txt; rm $FILE $FILE.txt
문서를 내보내려면 다음을 클릭하세요 File
.Export
원하는 출력 형식을 선택합니다.
문서에 그림이 있으면 html
텍스트 형식을 사용하는 것이 좋습니다.
텍스트만 있는 경우 일반 텍스트 형식을 사용하는 것이 가장 좋습니다 txt
.