wget によるサイトのミラーリングが失敗します - ユーザーエージェントがあっても 403 Forbidden が発生します

wget によるサイトのミラーリングが失敗します - ユーザーエージェントがあっても 403 Forbidden が発生します

次の URL から suricata の最新ルールをダウンロードする必要があります:

http://rules.emergingthreats.net/blockrules/

alertさまざまな新しいルールと Snort のルールに基づいて、独自のルールを作成しようとしています。を に置き換えようとしていますdrop

rules.emergingthreats.netApache 2.2.22 が何らかの理由で に設定されているため、すべてのルールをダウンロードすることすらできませんwget

私のコマンドは次のようになります:

# wget -m --user-agent="Mozilla/5.0 (X11; U; Linux x86_64; en-US) AppleWebKit/534.3 (KHTML, like Gecko) Chrome/6.0.472.63 Safari/534.3"  "https://rules.emergingthreats.net/"

サイト全体をミラーリングしようとしています。

--2014-07-22 06:18:49--  https://rules.emergingthreats.net/
Resolving rules.emergingthreats.net (rules.emergingthreats.net)... 204.12.217.19, 96.43.137.99
Connecting to rules.emergingthreats.net (rules.emergingthreats.net)|204.12.217.19|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: unspecified [text/html]
Saving to: ‘rules.emergingthreats.net/index.html’

    [ <=>                                                                                                                                                                    ] 1,951       --.-K/s   in 0s      

Last-modified header missing -- time-stamps turned off.
2014-07-22 06:18:50 (23.3 MB/s) - ‘rules.emergingthreats.net/index.html’ saved [1951]

その後、すべての内部ディレクトリは次のようになります403 Forbidden:

--2014-07-22 06:18:51--  https://rules.emergingthreats.net/blockrules/
Reusing existing connection to rules.emergingthreats.net:443.
HTTP request sent, awaiting response... 403 Forbidden
2014-07-22 06:18:51 ERROR 403: Forbidden.

サイト(ディレクトリ)を正常に参照でき、ブラウザ(chromium(Ubuntu))を使用して任意のファイルをダウンロードできます。

wgetデータの取得に失敗するのはなぜですか?

答え1

試す

wget -mk -w 20 --user-agent="Mozilla/4.5 (X11; U; Linux x86_64; en-US)" https://rules.emergingthreats.net

サイトは新しいブラウザの仕様を認識していない可能性があり、サイトの URL が引用符で囲まれています

関連情報