PDF 内のすべてのリンクをダウンロードするにはどうすればいいですか?

PDF 内のすべてのリンクをダウンロードするにはどうすればいいですか?

PDF が多数あり、その中にあるすべてのハイパーリンクをダウンロードする必要があります。Firefox で PDF を開いて「すべてダウンロード」を使用してみましたが、すべてがダウンロードされないことがよくあります。どうすればこれを実現できますか?

答え1

興味深い質問ですね。私は、利用可能な場合は常にコマンドライン ユーティリティを使用するので、この場合は次のものを使用しています。

どちらも移植可能です (PDFtk はインストーラーとしてのみ利用可能ですが、pdftk.exe と libiconv2.dll を他の場所にコピーして、必要に応じてアンインストールすることができます)。もちろん、Wget を cURL などに置き換えることもできます。

Windows のコマンド ラインから次のコマンドを実行すると、PDF からリンクされているすべてのドキュメント/ページがダウンロードされます。

for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

複数の PDF の場合は次のコマンドを使用します。

for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"

関連情報