
wenn ich ein wget auf BBC RSS mache, funktioniert es einwandfrei:
wget http://feeds.bbci.co.uk/news/world/rss.xml
Aber wenn ich das mit Zeiten mache, erhalte ich einen 403 Forbidden-Fehler:
wget http://www.thetimes.co.uk/tto/news/rss
Auch wenn dies der richtige RSS sein soll: http://www.thetimes.co.uk/tto/newsrss/?service=rss
Was übersehe ich bitte?
Antwort1
In den meisten Fällen werden Fehler wie „403 Forbidden“ behoben, indem Sie wget mit einem Benutzeragenten ausstatten:
wget -U "Mozilla" http://www.thetimes.co.uk/tto/news/rss
Das hat bei mir funktioniert.
Antwort2
Die Anforderung schlägt möglicherweise fehl, weil die Times auf Grundlage des bereitgestellten Benutzeragenten filtert.
Um Ihren Benutzeragenten so zu ändern, dass er sich unter OSX als Firefox ausgibt, versuchen Sie Folgendes:
wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://www.thetimes.co.uk/tto/news/rss