
我有很多 PDF 文件,需要下載其中的所有超連結。我嘗試過在 Firefox 中開啟 PDF 並使用“全部下載”,但我發現它通常無法取得全部內容。那麼我該怎麼做才能做到這一點呢?
答案1
有趣的問題!我偏好命令列實用程式(只要可用),因此在本例中我使用以下命令:
兩者都是可移植的(PDFtk 僅作為安裝程式提供,但您可以將 pdftk.exe 和 libiconv2.dll 複製到其他地方,然後根據需要將其卸載)。您當然可以用 cURL 或您喜歡的任何內容替換 Wget。
從 Windows 命令列執行以下命令將下載 PDF 連結到的所有文件/頁面:
for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"
對多個 PDF 使用以下命令:
for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"