
si hago un wget en BBC RSS, funciona bien:
wget http://feeds.bbci.co.uk/news/world/rss.xml
Pero si hago eso con veces, aparece un error 403 prohibido:
wget http://www.thetimes.co.uk/tto/news/rss
Aunque este debería ser el rss correcto: http://www.thetimes.co.uk/tto/newsrss/?service=rss
¿Qué me falta por favor?
Respuesta1
En la mayoría de los casos, proporcionar a wget un agente de usuario resolverá errores como 403 prohibido:
wget -U "Mozilla" http://www.thetimes.co.uk/tto/news/rss
Esto funcionó para mí.
Respuesta2
Es posible que la solicitud esté fallando porque el Times está filtrando según el agente de usuario proporcionado.
Para cambiar su agente de usuario para que se haga pasar por Firefox en OSX, intente esto:
wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://www.thetimes.co.uk/tto/news/rss