Как скачать все ссылки в PDF?

Как скачать все ссылки в PDF?

У меня много PDF-файлов, и мне нужно загрузить все гиперссылки в них. Я пробовал открыть PDF-файл в Firefox и использовать функцию Download Them All, но обнаружил, что часто не все из них загружаются. Так как же мне это сделать?

решение1

Интересный вопрос! Я неравнодушен к утилитам командной строки, если они доступны, поэтому в этом случае я использую следующее:

Оба являются портативными (PDFtk доступен только как установщик, но вы можете скопировать pdftk.exe и libiconv2.dll в другое место и удалить его, если хотите). Конечно, вы можете заменить Wget на cURL или что-то еще, что вам нравится.

Следующая команда, выполненная из командной строки Windows, загрузит все документы/страницы, на которые есть ссылки, из PDF-файла:

for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

Для нескольких PDF-файлов используйте следующую команду:

for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

Связанный контент