Quando tento detectar texto no meu jpeg, ele mostra corretamente todas as áreas onde suspeita de texto e imagens, mas quando exporto para ODT ele apenas cria um ODT com quadros de texto e imagens vazios.
Tenho que configurar tesseract
de alguma forma?
(Eu uso Ubuntu 14.10 32 bits)
Responder1
Experimente isto:
Abra o programa ocrfeeder.
Edite o mecanismo: Clique em Tools
-OCR Engine
Selecione Tesseract engine
e cliqueEdit
Onde diz que arguments engine
mudou o script para isso:
$IMAGE $FILE -l eng -psm 3 > /dev/null 2> /dev/null; cat $FILE.txt; rm $FILE $FILE.txt
Para exportar o documento clique File
-Export
Selecione o formato de saída desejado.
Se o documento tiver imagens aconselho usar o html
formato texto.
Se só tiver texto o melhor é usar o formato texto simples txt
.