Как загрузить PDF-файл, встроенный в веб-страницу с помощью JavaScript

Как загрузить PDF-файл, встроенный в веб-страницу с помощью JavaScript

Конкретнее, "http://krishikosh.egranth.ac.in" - это репозиторий Thesis. Раньше IDM мог захватывать все запросы PDF, но теперь некоторые кодировки были изменены, и теперь они недоступны. При переходе на вкладку сети он показывает его как файл XHR в pdf.worker.js.

Вот ссылка на пробную версию

http://krishikosh.egranth.ac.in/displaybitstream?handle=1/5810062295

Пожалуйста помоги.

решение1

Как вы упомянули, на рассматриваемом сайте есть меры, предотвращающие загрузку. В Интернете это в основном замедление. Если документ доступен в Сети для просмотра, во время просмотра документ находится на вашем компьютере и может быть извлечен для последующего использования.

Одним из простых решений является использованиезавиток, инструмент командной строки, доступный во многих операционных системах, и объедините его с инструментами разработчика Google Chrome. Chrome на вкладке «Сеть» может выводить готовую команду curl из PDF-загрузки, сделанной на веб-сайте, для вставки в командную строку.

Я сократил вывод до минимума:

curl 'https://krishikosh.egranth.ac.in/bitstream/1/5810062295/1/Anil%20Kumar%202601' \
  -X 'POST' \
  -H 'keyname: Akz914723960' \
  -H 'Content-Length: 0' \
  -H 'Type: application/pdf' \
  --output Document.pdf

Этот подход не является общим для всех документов на сайте, но загрузит указанный PDF в файл с именем Document.pdfна вашем собственном диске. Критическая мера безопасности, используемая сайтом, — этоимя ключа-заголовок.

Связанный контент