Warum schlägt wget bei dieser URL fehl?

Warum schlägt wget bei dieser URL fehl?

wenn ich ein wget auf BBC RSS mache, funktioniert es einwandfrei:

wget http://feeds.bbci.co.uk/news/world/rss.xml

Aber wenn ich das mit Zeiten mache, erhalte ich einen 403 Forbidden-Fehler:

wget http://www.thetimes.co.uk/tto/news/rss

Auch wenn dies der richtige RSS sein soll: http://www.thetimes.co.uk/tto/newsrss/?service=rss

Was übersehe ich bitte?

Antwort1

In den meisten Fällen werden Fehler wie „403 Forbidden“ behoben, indem Sie wget mit einem Benutzeragenten ausstatten:

wget -U "Mozilla" http://www.thetimes.co.uk/tto/news/rss

Das hat bei mir funktioniert.

Antwort2

Die Anforderung schlägt möglicherweise fehl, weil die Times auf Grundlage des bereitgestellten Benutzeragenten filtert.

Um Ihren Benutzeragenten so zu ändern, dass er sich unter OSX als Firefox ausgibt, versuchen Sie Folgendes:

wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://www.thetimes.co.uk/tto/news/rss

verwandte Informationen