¿Por qué `wget` descarga index.html en lugar de un archivo directo?

¿Por qué `wget` descarga index.html en lugar de un archivo directo?

Sólo estoy intentando descargar esto, pero siempre redirige a la página principal y al final simplemente descargo el archivo index.html, no el archivo que estoy intentando descargar:

http://tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip

¿Saben cómo descargarlo correctamente? Usé --user-agent="firefox+linux, IE+windows, (cualquier cosa que se te ocurra)" pero no funciona.

Este es el resultado, es lo mismo con --user-agenthabilitado:

jaheaga@jaheaga:~$ wget  http://www.tweaking.com/files/setups /tweaking.com_windows_repair_aio.zip--2012-04-13 19:40:07--  http://www.tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip
Resolviendo www.tweaking.com... 199.119.100.39
Conectando con www.tweaking.com[199.119.100.39]:80... conectado.
Petición HTTP enviada, esperando respuesta... 302 Found
Ubicación: http://tweaking.com [siguiente]
--2012-04-13 19:40:08--  http://tweaking.com/
Resolviendo tweaking.com... 199.119.100.39
Reutilizando la conexión con www.tweaking.com:80.
Petición HTTP enviada, esperando respuesta... 302 Moved Temporarily
Ubicación: http://www.tweaking.com [siguiente]
--2012-04-13 19:40:08--  http://www.tweaking.com/
Reutilizando la conexión con www.tweaking.com:80.
Petición HTTP enviada, esperando respuesta... 200 OK
Longitud: no especificado [text/html]
Grabando a: “tweaking.com_windows_repair_aio.zip.1”

    [ <=>                                                                            ]     46.913       234K/s   en 0,2s    

2012-04-13 19:40:09 (234 KB/s) - “tweaking.com_windows_repair_aio.zip.1” guardado [46913]

Respuesta1

El agente de usuario es un buen comienzo, pero no suficiente en ese caso. Otro valor de encabezado HTTP que se comprueba a menudo es 'Referer' [¡sic!]. VerWikipedia: referente HTTP.

wget tiene una --referer=urlopción para especificar la página de referencia. El análisis del tráfico para una descarga exitosa Wiresharkmuestra que utilizó la siguiente solicitud de un sistema de prueba mío:

GET /files/setups/tweaking.com_windows_repair_aio.zip HTTP/1.1
Host: www.tweaking.com
User-Agent: Mozilla/5.0 (X11; Ubuntu; Linux i686; rv:11.0) Gecko/20100101 Firefox/11.0
Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8
Accept-Language: en-gb,en;q=0.5
Accept-Encoding: gzip, deflate
Connection: keep-alive
Referer: http://www.tweaking.com/content/page/windows_repair_all_in_one.html

En este caso, incluso parece que no es necesario falsificar un archivo User-Agent.

wget --referer=http://www.tweaking.com/content/page/windows_repair_all_in_one.html  http://www.tweaking.com/files/setups/tweaking.com_windows_repair_aio.zip

Hace el truco.

información relacionada