cuneiforme -l eng -f texto -o outocr.txt input.pdf
El comando anterior, cuando se ejecuta en la terminal, genera solo el texto de mi página de título PDF en el archivo outocr.txt. ¿Qué debo hacer para que reconozca todo el texto del PDF de 120 páginas? Estoy usando Fedora Linux 25 (x86_64).
Respuesta1
Esta publicación proporciona un script de ejemplo para leer muchas páginas individuales y crear un PDF de varias páginas. La escritura cuneiforme por sí sola no crea documentos de varias páginas. ¿Cómo extraer texto con OCR de un PDF en Linux?