wget falla al reflejar el sitio - 403 Prohibido, incluso con el agente de usuario

wget falla al reflejar el sitio - 403 Prohibido, incluso con el agente de usuario

Necesito descargar las últimas reglas de suricata desde esta URL:

http://rules.emergingthreats.net/blockrules/

Estoy tratando de componer mis propias reglas basadas en diferentes reglas emergentes y también en las reglas de Snort. Tratando de reemplazar alertcondrop .

Ni siquiera puedo descargar todas las reglas, porque Apache 2.2.22 está rules.emergingthreats.netconfigurado de alguna manera en contrawget .

Mi comando se parece a:

# wget -m --user-agent="Mozilla/5.0 (X11; U; Linux x86_64; en-US) AppleWebKit/534.3 (KHTML, like Gecko) Chrome/6.0.472.63 Safari/534.3"  "https://rules.emergingthreats.net/"

Estoy intentando reflejar todo el sitio.

--2014-07-22 06:18:49--  https://rules.emergingthreats.net/
Resolving rules.emergingthreats.net (rules.emergingthreats.net)... 204.12.217.19, 96.43.137.99
Connecting to rules.emergingthreats.net (rules.emergingthreats.net)|204.12.217.19|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘rules.emergingthreats.net/index.html’

    [ <=>                                                                                                                                                                    ] 1,951       --.-K/s   in 0s      

Last-modified header missing -- time-stamps turned off.
2014-07-22 06:18:50 (23.3 MB/s) - ‘rules.emergingthreats.net/index.html’ saved [1951]

A partir de entonces, todos los directorios internos me dan 403 Forbidden:

--2014-07-22 06:18:51--  https://rules.emergingthreats.net/blockrules/
Reusing existing connection to rules.emergingthreats.net:443.
HTTP request sent, awaiting response... 403 Forbidden
2014-07-22 06:18:51 ERROR 403: Forbidden.

Estoy navegando exitosamente por el sitio (directorio), puedo descargar cualquier archivo con mi navegador - chromium (Ubuntu).

¿Por qué wgetno se pueden recuperar los datos?

Respuesta1

Intentar

wget -mk -w 20 --user-agent="Mozilla/4.5 (X11; U; Linux x86_64; en-US)" https://rules.emergingthreats.net

Es posible que el sitio no conozca las especificaciones más recientes del navegador y usted tenía la URL del sitio entre comillas.

información relacionada