
Eu tenho um arquivo PDF que é a digitalização de um formulário contendo imagens, tabelas e texto.
Gostaria de executar um programa (não uma ferramenta on-line) no arquivo e produzir um arquivo txt contendo as palavras. Não estou muito preocupado com a formatação.
Observe que isso não é uma repetição de 'Converter PDF em texto ignorando a estrutura', pois se refere ao texto em documentos PDF simples, não a imagens digitalizadas armazenadas como PDF.