Como usar o wget para baixar de sites de hospedagem?

Como usar o wget para baixar de sites de hospedagem?

wget é uma ferramenta muito útil para baixar coisas da internet rapidamente, mas posso usá-lo para baixar de sites de hospedagem, como FreakShare, IFile.it Depositfiles, Uploaded, Rapidshare? Se sim, como posso fazer isso?

Responder1

Este tipo de site tenta dificultar o não uso de um navegador gráfico, pois se você usar o wget perderá todos esses anúncios que pagam pela largura de banda.

Alguns sites não fazem verificações avançadas e podem ser facilmente enganados: diga ao wget para fingir queé realmente Mozillae isso évindo do site de download.

wget --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' \
     --referer=http://downloadsite.example.com/download-page-url
     http://downloadsite.example.com/download-page-url/filename.ext`

A maioria dos sites que verificam permite que você --user-agent=Mozilladefina --referero URL do arquivo que está baixando.

Com alguns sites, pode ser necessário exportar os cookies do navegador e passá-los --load-cookiespara o wget; neste ponto, usar o wget começa a dar mais trabalho do que um download manual. O método final, que pode funcionar o tempo todo, mas requer alguma codificação para cada site, é usar uma estrutura de automação de navegador, comoSelênioouWatir.

Veja tambémAutomatizando solicitações da web usando curl?

Responder2

Para Zippyshare:

Este método se baseiaResposta de Gilles. Como ele disse, o truque é fazer o servidor pensar que a solicitação está sendo feita a partir de um navegador e para que isso aconteça, você precisa de algumas coisas:

  • O link de download (o link real para o arquivo)
  • Link Referrer (a página da web com o botão de download)
  • ID de sessão Zippyshare (encontrado em cookies)

Aqui está uma captura de tela explicando onde você pode obter cada item:

Baixe do Zippyshare

Agora abra seu terminal e use o seguinte comando (substituindo os itens necessários):

wget <download_link> \
--referer='<referrer>' \
--cookies=off --header "Cookie: JSESSIONID=<session_id>" \
--user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1'

Exemplo:

wget http://www16.zippyshare.com/d/29887835/8895183/hello.txt \
--referer='http://www16.zippyshare.com/v/29887835/file.html' \
--cookies=off --header "Cookie: JSESSIONID=26458C0893BF69F88EB5743D74FE0F8C" \
--user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1'

Observação:No comando, na verdade referernão éreferrer

Responder3

Eu também gostaria de obter respostas perfeitas acima, usei o seguinte truque para baixar um filme infantil para meu filho do Turbobit:

Em vez de SESSION_ID da resposta acima, você precisa encontrar "compid" na guia de cookies do FIREBUG:

insira a descrição da imagem aqui

Depois disso, o comando para meu sistema embarcado Debian foi muito fácil:

wget --referer='http://http://turbobit.net/download/free/yilmacr4e351' --cookies=off --header "Cookie: compid=c9255510c34624435292d8a0e7e405be66aa01f9%7ED01343F87AB53A2C38D957A564DA1D55" --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' http://turbobit.net/download/redirect/B3EDACDA9B899937A149D5AAB6662327/yilmacr4e351/Ters.Yuz.2015.1080P.WEBDL.TR.EN.mkv &

Posso desligar meu computador agora :)

informação relacionada