
Конкретнее, "http://krishikosh.egranth.ac.in" - это репозиторий Thesis. Раньше IDM мог захватывать все запросы PDF, но теперь некоторые кодировки были изменены, и теперь они недоступны. При переходе на вкладку сети он показывает его как файл XHR в pdf.worker.js.
Вот ссылка на пробную версию
http://krishikosh.egranth.ac.in/displaybitstream?handle=1/5810062295
Пожалуйста помоги.
решение1
Как вы упомянули, на рассматриваемом сайте есть меры, предотвращающие загрузку. В Интернете это в основном замедление. Если документ доступен в Сети для просмотра, во время просмотра документ находится на вашем компьютере и может быть извлечен для последующего использования.
Одним из простых решений является использованиезавиток, инструмент командной строки, доступный во многих операционных системах, и объедините его с инструментами разработчика Google Chrome. Chrome на вкладке «Сеть» может выводить готовую команду curl из PDF-загрузки, сделанной на веб-сайте, для вставки в командную строку.
Я сократил вывод до минимума:
curl 'https://krishikosh.egranth.ac.in/bitstream/1/5810062295/1/Anil%20Kumar%202601' \
-X 'POST' \
-H 'keyname: Akz914723960' \
-H 'Content-Length: 0' \
-H 'Type: application/pdf' \
--output Document.pdf
Этот подход не является общим для всех документов на сайте, но загрузит указанный PDF в файл с именем Document.pdf
на вашем собственном диске. Критическая мера безопасности, используемая сайтом, — этоимя ключа-заголовок.