Cuando intento detectar texto en mi jpeg, muestra correctamente todas las áreas donde sospecha texto e imágenes, pero cuando lo exporto a ODT solo crea un ODT con marcos de texto e imágenes vacíos.
¿Tengo que configurar tesseract
de alguna manera?
(Yo uso Ubuntu 14.10 de 32 bits)
Respuesta1
Prueba esto:
Abra el programa ocrfeeder.
Edite el motor: haga clic en Tools
-OCR Engine
Seleccione Tesseract engine
y haga clicEdit
Donde dice arguments engine
cambió el script por esto:
$IMAGE $FILE -l eng -psm 3 > /dev/null 2> /dev/null; cat $FILE.txt; rm $FILE $FILE.txt
Para exportar el documento, haga clic en File
-Export
Seleccione el formato de salida deseado.
Si el documento tiene imágenes aconsejo utilizar el html
formato texto.
Si solo tiene texto lo mejor es utilizar el formato texto plano txt
.