PDF 内のすべてのリンクをダウンロードするにはどうすればいいですか?

Question

興味深い質問ですね。私は、利用可能な場合は常にコマンドラインユーティリティを使用するので、この場合は次のものを使用しています。

どちらも移植可能です (PDFtk はインストーラーとしてのみ利用可能ですが、pdftk.exe と libiconv2.dll を他の場所にコピーして、必要に応じてアンインストールすることができます)。もちろん、Wget を cURL などに置き換えることもできます。

Windows のコマンドラインから次のコマンドを実行すると、PDF からリンクされているすべてのドキュメント/ページがダウンロードされます。

for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

複数の PDF の場合は次のコマンドを使用します。

for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

Answer 1

興味深い質問ですね。私は、利用可能な場合は常にコマンドラインユーティリティを使用するので、この場合は次のものを使用しています。

どちらも移植可能です (PDFtk はインストーラーとしてのみ利用可能ですが、pdftk.exe と libiconv2.dll を他の場所にコピーして、必要に応じてアンインストールすることができます)。もちろん、Wget を cURL などに置き換えることもできます。

Windows のコマンドラインから次のコマンドを実行すると、PDF からリンクされているすべてのドキュメント/ページがダウンロードされます。

for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

複数の PDF の場合は次のコマンドを使用します。

for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

関連情報