ウェブページにJavaScriptが埋め込まれたPDFをダウンロードする方法

Question

ご指摘のとおり、問題の Web サイトにはダウンロードを阻止する対策が講じられています。Web では、これは主に速度低下です。文書がインターネット上で閲覧可能な場合、閲覧中は文書がコンピュータ上に存在し、後で使用するために抽出することができます。

簡単な解決策の1つは、カール多くのオペレーティングシステムで使用できるコマンドラインツールであるを使用し、それを Google Chrome 開発者ツールと組み合わせます。Chrome の [ネットワーク] タブでは、Web サイトで作成された PDF 読み込みから既製の curl コマンドを出力し、コマンドプロンプトに貼り付けることができます。

出力を最低限に抑えました。

curl 'https://krishikosh.egranth.ac.in/bitstream/1/5810062295/1/Anil%20Kumar%202601' \
  -X 'POST' \
  -H 'keyname: Akz914723960' \
  -H 'Content-Length: 0' \
  -H 'Type: application/pdf' \
  --output Document.pdf

この方法はウェブサイト上のすべての文書に適用されるわけではありませんが、指定されたPDFを自分のドライブに名前を付けたファイルにダウンロードしますDocument.pdf。ウェブサイトが使用する重要なセキュリティ対策は、キー名-ヘッダ。

Answer 1

ご指摘のとおり、問題の Web サイトにはダウンロードを阻止する対策が講じられています。Web では、これは主に速度低下です。文書がインターネット上で閲覧可能な場合、閲覧中は文書がコンピュータ上に存在し、後で使用するために抽出することができます。

簡単な解決策の1つは、カール多くのオペレーティングシステムで使用できるコマンドラインツールであるを使用し、それを Google Chrome 開発者ツールと組み合わせます。Chrome の [ネットワーク] タブでは、Web サイトで作成された PDF 読み込みから既製の curl コマンドを出力し、コマンドプロンプトに貼り付けることができます。

出力を最低限に抑えました。

curl 'https://krishikosh.egranth.ac.in/bitstream/1/5810062295/1/Anil%20Kumar%202601' \
  -X 'POST' \
  -H 'keyname: Akz914723960' \
  -H 'Content-Length: 0' \
  -H 'Type: application/pdf' \
  --output Document.pdf

この方法はウェブサイト上のすべての文書に適用されるわけではありませんが、指定されたPDFを自分のドライブに名前を付けたファイルにダウンロードしますDocument.pdf。ウェブサイトが使用する重要なセキュリティ対策は、キー名-ヘッダ。

ウェブページにJavaScriptが埋め込まれたPDFをダウンロードする方法

答え1

関連情報