Cómo podemos descargar un PDF incrustado con javascript en una página web

Cómo podemos descargar un PDF incrustado con javascript en una página web

Más específicamente de "http://krishikosh.egranth.ac.in" es un repositorio de Tesis. Anteriormente, IDM podía capturar todas las solicitudes de PDF, pero ahora se han modificado algunas codificaciones y ahora no se puede acceder a ellas. Al llegar a la pestaña de red, lo muestra como un archivo XHR en pdf.worker.js.

Aquí hay un enlace de prueba.

http://krishikosh.egranth.ac.in/displaybitstream?handle=1/5810062295

Por favor ayuda.

Respuesta1

Como mencionaste, el sitio web en cuestión tiene medidas que impiden la descarga. En la web, esto es principalmente una desaceleración. Si un documento está disponible en Internet para que lo vea, durante la visualización el documento estará en su computadora y podrá extraerlo para su uso posterior.

Una de las soluciones simples es utilizarrizo, una herramienta de línea de comandos disponible en muchos sistemas operativos y la combina con las herramientas de desarrollo de Google Chrome. Chrome en la pestaña Red puede generar un comando curl listo para usar a partir de la carga de PDF realizada en el sitio web para pegarlo en un símbolo del sistema.

Reduje la salida al mínimo:

curl 'https://krishikosh.egranth.ac.in/bitstream/1/5810062295/1/Anil%20Kumar%202601' \
  -X 'POST' \
  -H 'keyname: Akz914723960' \
  -H 'Content-Length: 0' \
  -H 'Type: application/pdf' \
  --output Document.pdf

Este enfoque no es genérico para todos los documentos del sitio web, pero descargará el PDF especificado en un archivo con nombre Document.pdfen su propio disco. La medida de seguridad crítica utilizada por el sitio web es laNombre clave-encabezamiento.

información relacionada