¿Cómo utilizar wget para descargar desde sitios de hosting?

¿Cómo utilizar wget para descargar desde sitios de hosting?

wget es una herramienta muy útil para descargar cosas de Internet rápidamente, pero ¿puedo usarla para descargar desde sitios de hosting, como FreakShare, IFile.it Depositfiles, Uploaded, Rapidshare? Si es así, ¿cómo puedo hacer eso?

Respuesta1

Este tipo de sitio intenta dificultar el uso de un navegador web gráfico, porque si usa wget se perderá todos estos anuncios que pagan por el ancho de banda.

Algunos sitios no realizan comprobaciones avanzadas y pueden ser engañados fácilmente: dígale a wget que finja esoes realmente Mozillay que esprocedente del sitio de descarga.

wget --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' \
     --referer=http://downloadsite.example.com/download-page-url
     http://downloadsite.example.com/download-page-url/filename.ext`

La mayoría de los sitios que verifican te permiten salirte con la tuya --user-agent=Mozillay --refererconfigurar la URL del archivo que estás descargando.

En algunos sitios, es posible que necesites exportar las cookies del navegador web y pasarlas --load-cookiesa wget; En este punto, usar wget comienza a ser más trabajo que una descarga manual. El método definitivo, que puede funcionar todo el tiempo pero requiere algo de codificación para cada sitio, es utilizar un marco de automatización del navegador comoSeleniooWatir.

Ver también¿Automatizar solicitudes web usando curl?

Respuesta2

Para Zippyshare:

Este método se basa enLa respuesta de Gilles.. Como dijo, el truco consiste en hacer que el servidor piense que la solicitud se realiza desde un navegador y, para que eso suceda, se necesitan un par de cosas:

  • El enlace de descarga (el enlace real al archivo)
  • Link Referrer (La página web con el botón de descarga)
  • ID de sesión de Zippyshare (que se encuentra en las cookies)

Aquí hay una captura de pantalla que explica dónde puede obtener cada artículo:

Descargar desde Zippyshare

Ahora abra su terminal y use el siguiente comando (reemplazando los elementos necesarios):

wget <download_link> \
--referer='<referrer>' \
--cookies=off --header "Cookie: JSESSIONID=<session_id>" \
--user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1'

Ejemplo:

wget http://www16.zippyshare.com/d/29887835/8895183/hello.txt \
--referer='http://www16.zippyshare.com/v/29887835/file.html' \
--cookies=off --header "Cookie: JSESSIONID=26458C0893BF69F88EB5743D74FE0F8C" \
--user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1'

Nota:refererEn el comando, de hecho no esreferrer

Respuesta3

También me gustaría obtener las respuestas perfectas anteriores. Utilicé el siguiente truco para descargar una película infantil para mi hijo desde Turbobit:

En lugar de SESSION_ID de la respuesta anterior, debe buscar "compid" en la pestaña de cookies de FIREBUG:

ingrese la descripción de la imagen aquí

Después de eso, el comando para mi sistema integrado Debian fue muy fácil:

wget --referer='http://http://turbobit.net/download/free/yilmacr4e351' --cookies=off --header "Cookie: compid=c9255510c34624435292d8a0e7e405be66aa01f9%7ED01343F87AB53A2C38D957A564DA1D55" --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' http://turbobit.net/download/redirect/B3EDACDA9B899937A149D5AAB6662327/yilmacr4e351/Ters.Yuz.2015.1080P.WEBDL.TR.EN.mkv &

Puedo apagar mi computadora ahora :)

información relacionada