
cuneiforme -l eng -f texto -o outocr.txt input.pdf
O comando acima, quando executado no terminal, gera apenas o texto da minha página de título do PDF para o arquivo outocr.txt. O que devo fazer para reconhecer todo o texto do PDF de 120 páginas? Estou usando o Fedora Linux 25 (x86_64).
Responder1
Esta postagem fornece um exemplo de script para ler muitas páginas individuais e criar um PDF de várias páginas. O cuneiforme por si só não cria documentos de várias páginas. Como extrair texto com OCR de um PDF no Linux?