Wie wir ein mit Javascript in eine Webseite eingebettetes PDF herunterladen können

Wie wir ein mit Javascript in eine Webseite eingebettetes PDF herunterladen können

Genauer gesagt handelt es sich bei „http://krischikosh.egranth.ac.in“ um ein Repository für Abschlussarbeiten. Zuvor konnte IDM alle PDF-Anfragen erfassen, aber jetzt wurden einige Codierungen geändert und es ist nicht mehr darauf zugegriffen werden. Beim Erreichen der Registerkarte „Netzwerk“ wird es als XHR-Datei unter pdf.worker.js angezeigt.

Hier ist ein Link für die Testversion

http://krischikosh.egranth.ac.in/displaybitstream?handle=1/5810062295

Bitte helfen Sie.

Antwort1

Wie Sie erwähnt haben, verfügt die betreffende Website über Maßnahmen, die den Download verhindern. Im Web handelt es sich dabei meist um eine Verlangsamung. Wenn ein Dokument im Internet zur Ansicht verfügbar ist, befindet es sich während der Anzeige auf Ihrem Computer und kann zur späteren Verwendung extrahiert werden.

Eine der einfachen Lösungen ist die VerwendungLocke, ein Befehlszeilentool, das in vielen Betriebssystemen verfügbar ist, und das mit den Entwicklertools von Google Chrome kombiniert wird. Chrome kann im Netzwerk-Tab einen vorgefertigten Curl-Befehl aus dem auf der Website erstellten PDF-Ladevorgang ausgeben, der in eine Eingabeaufforderung eingefügt werden kann.

Ich habe die Ausgabe auf das absolute Minimum reduziert:

curl 'https://krishikosh.egranth.ac.in/bitstream/1/5810062295/1/Anil%20Kumar%202601' \
  -X 'POST' \
  -H 'keyname: Akz914723960' \
  -H 'Content-Length: 0' \
  -H 'Type: application/pdf' \
  --output Document.pdf

Dieser Ansatz ist nicht für alle Dokumente auf der Website gültig, sondern lädt das angegebene PDF in eine Datei mit dem Namen Document.pdfauf Ihrem eigenen Laufwerk herunter. Die kritische Sicherheitsmaßnahme der Website ist dieSchlüsselname-Header.

verwandte Informationen