Cómo extraer texto de un pdf basado en imágenes usando Cuneiforme en la terminal

Cómo extraer texto de un pdf basado en imágenes usando Cuneiforme en la terminal

cuneiforme -l eng -f texto -o outocr.txt input.pdf

El comando anterior, cuando se ejecuta en la terminal, genera solo el texto de mi página de título PDF en el archivo outocr.txt. ¿Qué debo hacer para que reconozca todo el texto del PDF de 120 páginas? Estoy usando Fedora Linux 25 (x86_64).

Respuesta1

Esta publicación proporciona un script de ejemplo para leer muchas páginas individuales y crear un PDF de varias páginas. La escritura cuneiforme por sí sola no crea documentos de varias páginas. ¿Cómo extraer texto con OCR de un PDF en Linux?

información relacionada