웹 페이지에 자바스크립트가 포함된 PDF를 다운로드하는 방법

웹 페이지에 자바스크립트가 포함된 PDF를 다운로드하는 방법

보다 구체적으로 "http://krishikosh.egranth.ac.in"에서는 Thesis의 저장소입니다. 이전에는 IDM이 모든 PDF 요청을 캡처할 수 있었지만 이제는 일부 코딩이 변경되어 액세스할 수 없습니다. 네트워크 탭에 도달하면 pdf.worker.js 아래에 XHR 파일로 표시됩니다.

체험판 링크는 다음과 같습니다

http://krishikosh.egranth.ac.in/displaybitstream?handle=1/5810062295

도와주세요.

답변1

말씀하신 대로 해당 웹사이트에는 다운로드를 방지하는 조치가 마련되어 있습니다. 웹에서는 대부분 속도가 느려집니다. 귀하가 볼 수 있는 문서가 The Net에 있는 경우, 보는 동안 해당 문서는 귀하의 컴퓨터에 있으며 나중에 사용하기 위해 추출할 수 있습니다.

간단한 해결책 중 하나는 다음을 사용하는 것입니다.곱슬 곱슬하다, 다양한 운영 체제에서 사용할 수 있는 명령줄 도구이며 이를 Google Chrome 개발자 도구와 결합합니다. 네트워크 탭의 Chrome은 웹사이트에서 만든 PDF 로드에서 미리 만들어진 컬 명령을 출력하여 명령 프롬프트에 붙여 넣을 수 있습니다.

출력을 최소한으로 줄였습니다.

curl 'https://krishikosh.egranth.ac.in/bitstream/1/5810062295/1/Anil%20Kumar%202601' \
  -X 'POST' \
  -H 'keyname: Akz914723960' \
  -H 'Content-Length: 0' \
  -H 'Type: application/pdf' \
  --output Document.pdf

이 접근 방식은 웹 사이트의 모든 문서에 일반적이지 않지만 지정된 PDF를 Document.pdf자신의 드라이브에 있는 파일 이름으로 다운로드합니다. 웹사이트에서 사용하는 중요한 보안 조치는키 이름-머리글.

관련 정보