
PDF が多数あり、その中にあるすべてのハイパーリンクをダウンロードする必要があります。Firefox で PDF を開いて「すべてダウンロード」を使用してみましたが、すべてがダウンロードされないことがよくあります。どうすればこれを実現できますか?
答え1
興味深い質問ですね。私は、利用可能な場合は常にコマンドライン ユーティリティを使用するので、この場合は次のものを使用しています。
どちらも移植可能です (PDFtk はインストーラーとしてのみ利用可能ですが、pdftk.exe と libiconv2.dll を他の場所にコピーして、必要に応じてアンインストールすることができます)。もちろん、Wget を cURL などに置き換えることもできます。
Windows のコマンド ラインから次のコマンドを実行すると、PDF からリンクされているすべてのドキュメント/ページがダウンロードされます。
for /f "tokens=2" %l in ('pdftk Test.pdf dump_data_annots ^| find "AnnotActionURI"') do wget "%l"
複数の PDF の場合は次のコマンドを使用します。
for %f in (*.pdf) do for /f "tokens=2" %l in ('pdftk "%~f" dump_data_annots ^| find "AnnotActionURI"') do wget "%l"