Como baixar todos os links em um PDF?

Como baixar todos os links em um PDF?

Tenho muitos PDFs e preciso baixar todos os hiperlinks contidos neles. Tentei abrir o PDF no Firefox e usar o Download Them All, mas acho que muitas vezes não consigo todos. Então, como posso conseguir isso?

Responder1

Pergunta interessante! Tenho preferência por utilitários de linha de comando sempre que disponíveis, portanto, neste caso, estou usando o seguinte:

Ambos são portáteis (PDFtk está disponível apenas como instalador, mas você pode copiar pdftk.exe e libiconv2.dll em outro lugar e desinstalá-lo se desejar). É claro que você pode substituir Wget por cURL ou o que quiser.

O seguinte executado na linha de comando do Windows fará o download de todos os documentos/páginas vinculados a um PDF:

for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

Use o seguinte comando para vários PDFs:

for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

informação relacionada