Como extrair texto de um PDF baseado em imagem usando Cuneiform no terminal

Como extrair texto de um PDF baseado em imagem usando Cuneiform no terminal

cuneiforme -l eng -f texto -o outocr.txt input.pdf

O comando acima, quando executado no terminal, gera apenas o texto da minha página de título do PDF para o arquivo outocr.txt. O que devo fazer para reconhecer todo o texto do PDF de 120 páginas? Estou usando o Fedora Linux 25 (x86_64).

Responder1

Esta postagem fornece um exemplo de script para ler muitas páginas individuais e criar um PDF de várias páginas. O cuneiforme por si só não cria documentos de várias páginas. Como extrair texto com OCR de um PDF no Linux?

informação relacionada