
Ich habe viele PDFs und muss alle darin enthaltenen Hyperlinks herunterladen. Ich habe versucht, die PDF in Firefox zu öffnen und „Alle herunterladen“ zu verwenden, aber ich stelle fest, dass oft nicht alle heruntergeladen werden. Wie kann ich das also erreichen?
Antwort1
Interessante Frage! Ich bevorzuge Befehlszeilenprogramme, wenn sie verfügbar sind. In diesem Fall verwende ich Folgendes:
Beide sind portabel (PDFtk ist nur als Installationsprogramm verfügbar, aber Sie können pdftk.exe und libiconv2.dll woanders hin kopieren und deinstallieren, wenn Sie möchten). Sie können Wget natürlich durch cURL oder etwas anderes ersetzen.
Durch die Ausführung des folgenden Befehls über die Windows-Befehlszeile werden alle mit einer PDF verknüpften Dokumente/Seiten heruntergeladen:
for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"
Verwenden Sie den folgenden Befehl für mehrere PDFs:
for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"