
se eu fizer um wget no RSS da BBC, tudo funcionará bem:
wget http://feeds.bbci.co.uk/news/world/rss.xml
Mas se eu fizer isso com o tempo, recebo um erro 403 proibido:
wget http://www.thetimes.co.uk/tto/news/rss
Mesmo que este seja o rss correto: http://www.thetimes.co.uk/tto/newsrss/?service=rss
O que estou perdendo, por favor?
Responder1
Na maioria dos casos, fornecer ao wget um agente de usuário resolverá erros como 403 proibido:
wget -U "Mozilla" http://www.thetimes.co.uk/tto/news/rss
Isso funcionou para mim.
Responder2
A solicitação pode estar falhando porque o Times está filtrando com base no agente do usuário fornecido.
Para alterar seu agente de usuário para se passar pelo Firefox no OSX, tente isto:
wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://www.thetimes.co.uk/tto/news/rss