Por que o wget está falhando neste URL?

Por que o wget está falhando neste URL?

se eu fizer um wget no RSS da BBC, tudo funcionará bem:

wget http://feeds.bbci.co.uk/news/world/rss.xml

Mas se eu fizer isso com o tempo, recebo um erro 403 proibido:

wget http://www.thetimes.co.uk/tto/news/rss

Mesmo que este seja o rss correto: http://www.thetimes.co.uk/tto/newsrss/?service=rss

O que estou perdendo, por favor?

Responder1

Na maioria dos casos, fornecer ao wget um agente de usuário resolverá erros como 403 proibido:

wget -U "Mozilla" http://www.thetimes.co.uk/tto/news/rss

Isso funcionou para mim.

Responder2

A solicitação pode estar falhando porque o Times está filtrando com base no agente do usuário fornecido.

Para alterar seu agente de usuário para se passar pelo Firefox no OSX, tente isto:

wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://www.thetimes.co.uk/tto/news/rss

informação relacionada