¿Por qué falla wget en esta URL?

¿Por qué falla wget en esta URL?

si hago un wget en BBC RSS, funciona bien:

wget http://feeds.bbci.co.uk/news/world/rss.xml

Pero si hago eso con veces, aparece un error 403 prohibido:

wget http://www.thetimes.co.uk/tto/news/rss

Aunque este debería ser el rss correcto: http://www.thetimes.co.uk/tto/newsrss/?service=rss

¿Qué me falta por favor?

Respuesta1

En la mayoría de los casos, proporcionar a wget un agente de usuario resolverá errores como 403 prohibido:

wget -U "Mozilla" http://www.thetimes.co.uk/tto/news/rss

Esto funcionó para mí.

Respuesta2

Es posible que la solicitud esté fallando porque el Times está filtrando según el agente de usuario proporcionado.

Para cambiar su agente de usuario para que se haga pasar por Firefox en OSX, intente esto:

wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://www.thetimes.co.uk/tto/news/rss

información relacionada