wget espelhamento do site falha - 403 Proibido, mesmo com user-agent

wget espelhamento do site falha - 403 Proibido, mesmo com user-agent

Preciso baixar as regras mais recentes do suricata neste URL:

http://rules.emergingthreats.net/blockrules/

Estou tentando compor minhas próprias regras com base em diferentes regras emergentes e também nas regras do snort. Tentando substituir alertpor drop.

Não consigo nem baixar todas as regras, pois o apache 2.2.22 rules.emergingthreats.netconfigurou de alguma forma contra o wget.

Meu comando se parece com:

# wget -m --user-agent="Mozilla/5.0 (X11; U; Linux x86_64; en-US) AppleWebKit/534.3 (KHTML, like Gecko) Chrome/6.0.472.63 Safari/534.3"  "https://rules.emergingthreats.net/"

Estou tentando espelhar todo o site.

--2014-07-22 06:18:49--  https://rules.emergingthreats.net/
Resolving rules.emergingthreats.net (rules.emergingthreats.net)... 204.12.217.19, 96.43.137.99
Connecting to rules.emergingthreats.net (rules.emergingthreats.net)|204.12.217.19|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘rules.emergingthreats.net/index.html’

    [ <=>                                                                                                                                                                    ] 1,951       --.-K/s   in 0s      

Last-modified header missing -- time-stamps turned off.
2014-07-22 06:18:50 (23.3 MB/s) - ‘rules.emergingthreats.net/index.html’ saved [1951]

Depois disso, todos os diretórios internos me fornecem 403 Forbidden:

--2014-07-22 06:18:51--  https://rules.emergingthreats.net/blockrules/
Reusing existing connection to rules.emergingthreats.net:443.
HTTP request sent, awaiting response... 403 Forbidden
2014-07-22 06:18:51 ERROR 403: Forbidden.

Consegui navegar com sucesso no site (diretório), posso baixar qualquer arquivo com meu navegador - chromium (Ubuntu).

Por que wgetnão consegue buscar os dados?

Responder1

Tentar

wget -mk -w 20 --user-agent="Mozilla/4.5 (X11; U; Linux x86_64; en-US)" https://rules.emergingthreats.net

O site pode não conhecer as especificações mais recentes do navegador e você colocou o URL do site entre aspas

informação relacionada