この URL で wget が失敗するのはなぜですか?

この URL で wget が失敗するのはなぜですか?

BBC RSS で wget を実行すると正常に動作します。

wget http://feeds.bbci.co.uk/news/world/rss.xml

しかし、これを時間とともに実行すると、403 禁止エラーが発生します。

wget http://www.thetimes.co.uk/tto/news/rss

これは正しい RSS であるはずですが: http://www.thetimes.co.uk/tto/newsrss/?service=rss

何が足りないのでしょうか?

答え1

ほとんどの場合、wget にユーザー エージェントを指定すると、403 forbidden などのエラーが解決されます。

wget -U "Mozilla" http://www.thetimes.co.uk/tto/news/rss

これは私にとってはうまくいきました。

答え2

Times は提供されたユーザー エージェントに基づいてフィルタリングを行っているため、リクエストが失敗する可能性があります。

OSX で Firefox を偽装するようにユーザー エージェントを変更するには、次を試してください。

wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://www.thetimes.co.uk/tto/news/rss

関連情報