이 URL에서 wget이 실패하는 이유는 무엇입니까?

이 URL에서 wget이 실패하는 이유는 무엇입니까?

BBC RSS에서 wget을 수행하면 정상적으로 작동합니다.

wget http://feeds.bbci.co.uk/news/world/rss.xml

하지만 계속 그렇게 하면 403 금지 오류가 발생합니다.

wget http://www.thetimes.co.uk/tto/news/rss

이것이 올바른 RSS를 의미하더라도: http://www.thetimes.co.uk/tto/newsrss/?service=rss

제가 무엇을 놓치고 있나요?

답변1

대부분의 경우 사용자 에이전트와 함께 wget을 제공하면 403 금지와 같은 오류가 해결됩니다.

wget -U "Mozilla" http://www.thetimes.co.uk/tto/news/rss

이것은 나에게 효과적이었습니다.

답변2

Times가 제공된 사용자 에이전트를 기반으로 필터링하기 때문에 요청이 실패할 수 있습니다.

OSX에서 Firefox를 가장하도록 사용자 에이전트를 변경하려면 다음을 시도하십시오.

wget --header="Accept: text/html" --user-agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10.8; rv:21.0) Gecko/20100101 Firefox/21.0" http://www.thetimes.co.uk/tto/news/rss

관련 정보