Exportieren Sie alle PDF-Dateien als Text mit Adobe Acrobar Pro DC

Exportieren Sie alle PDF-Dateien als Text mit Adobe Acrobar Pro DC

Frage:Wie bringe ich Adobe Acrobat Pro DC dazu, alle PDF-Dateien in einem Ordner als Textdateien zu exportieren?

Mithilfe des Aktionsassistenten im Menü „Extras“ von Adobe Acrobat Pro DC konnte ich einen benutzerdefinierten Befehl erstellen, mit dem ich Tausende von Bildern als PDF-Dateien exportieren (OCR) konnte. Diese Bilder möchte ich nun exportieren; sie sind nun als Textdateien durchsuchbar. Ich kann jedoch scheinbar keinen ähnlichen Satz von Tools dafür finden.

Hinweis: Es gibt eine Exportschaltfläche, mit der ich Dateien einzeln als Textdatei exportieren kann, aber ich kann scheinbar nichts finden, mit dem ich einen Befehl für den gesamten Ordner ausführen kann.

EDIT: Ich habe den Kundendienst angerufen und eine mögliche Lösung besteht darin, alle Dateien in einer großen PDF-Datei zusammenzufassen und diese dann zu exportieren. Andererseits brauche ich für jede als Text exportierte PDF-Datei eine separate ID, daher ist das keine Option.

Antwort1

Sie können PowerShell in Kombination mitXpdf.

Xpdf installiert ein Programm namens pdftotext, das von einem PowerShell-Skript wie dem folgenden aufgerufen werden kann:

$FILES= ls *.pdf
foreach ($f in $FILES) {
    & "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "$f"
}

Ein ähnliches Batch-Skript kann aus einer .batDatei aufgerufen werden, ohne dass PowerShell verwendet werden muss:

for /f %%G in ('dir /b') do {
  "C:\Program Files\xpdf\bin32\pdftotext.exe" -enc UTF-8 "%%G"
)

(Hinweis: Keines der Skripte wurde getestet.)

verwandte Informationen