Exporte todos os arquivos PDF como texto usando Adobe Acrobar Pro DC

Exporte todos os arquivos PDF como texto usando Adobe Acrobar Pro DC

Pergunta:Como faço para que o Adobe Acrobat Pro DC exporte todos os arquivos PDF em uma pasta como arquivos de texto?

Usando o Action Wizard no menu Ferramentas do Adobe Acrobat Pro DC consegui criar um comando personalizado que me permitiu exportar (OCR) milhares de imagens como arquivos PDF. Agora quero exportar essas imagens; que agora podem ser pesquisados ​​como arquivos de texto. No entanto, não consigo encontrar um conjunto semelhante de ferramentas para fazer isso.

Nota: Existe um botão de exportação que me permite exportar um arquivo de cada vez como um arquivo de texto, mas não consigo encontrar algo que me permita executar um comando em uma pasta inteira.

EDIT: Liguei para o suporte ao cliente e uma possível solução é combinar todos os arquivos em um arquivo PDF gigante e depois exportar o arquivo PDF. Por outro lado, preciso de um ID separado para cada arquivo PDF exportado como texto, portanto isso não é uma opção.

Responder1

Você pode usar o PowerShell combinado comXpdf.

O Xpdf instalará um programa chamado pdftotext, que pode ser invocado a partir de um script do PowerShell, como:

$FILES= ls *.pdf
foreach ($f in $FILES) {
    & "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "$f"
}

Um script em lote semelhante pode ser invocado a partir de um .batarquivo sem usar o PowerShell:

for /f %%G in ('dir /b') do {
  "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "%%G"
)

(Observação: nenhum dos scripts foi testado.)

informação relacionada