我只是想下載這個,但它總是重定向到主頁,最後只下載 index.html 文件,而不是我要下載的文件:
http://tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip
大家知道如何正確下載嗎?我使用了 --user-agent="firefox+linux, IE+windows, (任何你能想到的)" 但它不起作用。
這是輸出,與--user-agent
啟用相同:
jaheaga@jaheaga:~$ wget http://www.tweaking.com/files/setups /tweaking.com_windows_repair_aio.zip--2012-04-13 19:40:07-- http://www.tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip
Resolviendo www.tweaking.com... 199.119.100.39
Conectando con www.tweaking.com[199.119.100.39]:80... conectado.
Petición HTTP enviada, esperando respuesta... 302 Found
Ubicación: http://tweaking.com [siguiente]
--2012-04-13 19:40:08-- http://tweaking.com/
Resolviendo tweaking.com... 199.119.100.39
Reutilizando la conexión con www.tweaking.com:80.
Petición HTTP enviada, esperando respuesta... 302 Moved Temporarily
Ubicación: http://www.tweaking.com [siguiente]
--2012-04-13 19:40:08-- http://www.tweaking.com/
Reutilizando la conexión con www.tweaking.com:80.
Petición HTTP enviada, esperando respuesta... 200 OK
Longitud: no especificado [text/html]
Grabando a: “tweaking.com_windows_repair_aio.zip.1”
[ <=> ] 46.913 234K/s en 0,2s
2012-04-13 19:40:09 (234 KB/s) - “tweaking.com_windows_repair_aio.zip.1” guardado [46913]
答案1
用戶代理是一個好的開始,但在這種情況下還不夠。經常檢查的另一個 HTTP 標頭值是“Referer”[原文如此! ]。看維基百科:HTTP 引用。
wget 有一個--referer=url
選項來指定引用頁面。分析成功下載的流量Wireshark
表明它使用了來自我的測試系統的以下請求:
GET /files/setups/tweaking.com_windows_repair_aio.zip HTTP/1.1
Host: www.tweaking.com
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:11.0) Gecko/20100101 Firefox/11.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-gb,en;q=0.5
Accept-Encoding: gzip, deflate
Connection: keep-alive
Referer: http://www.tweaking.com/content/page/windows_repair_all_in_one.html
對於這種情況,您似乎甚至不需要偽造User-Agent
.
wget --referer=http://www.tweaking.com/content/page/windows_repair_all_in_one.html http://www.tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip
確實有竅門。