
재귀 옵션을 켠 상태에서 wget을 사용할 때 파일을 다운로드하려고 하면 오류 메시지가 나타납니다. 실제로는 내가 원하는 파일(또는 따라갈 추가 링크)이 포함된 페이지로 이동하기 위해 링크를 따라야 하는데 링크가 다운로드 가능한 파일이라고 생각합니다.
wget -r -l 16 --accept=jpg website.com
오류 메시지는 다음과 같습니다. .... 거부되어야 하기 때문입니다. 이는 일반적으로 가져오려는 웹사이트 링크가 SQL 문으로 끝날 때 발생합니다. 그러나 해당 링크에서 동일한 wget 명령을 사용할 때는 문제가 발생하지 않습니다. 페이지를 가져오는 방법을 정확히 알고 싶습니다. 프로젝트가 얼마나 지저분한지는 모르겠지만 언제든지 소스를 살펴볼 수 있을 것 같습니다. wget의 맥락에서 "재귀"가 의미하는 바가 정확히 무엇인지 누락되었을 수도 있습니다. 나는 그것이 내가 요청한 확장자를 가진 파일을 얻기 위해 각 링크를 통과하고 여행할 것이라고 생각했습니다.
나는 이것을 stackOverFlow에 게시했지만 그들은 나를 여기로 넘겼습니다. :) 여러분이 도움을 주셨으면 좋겠습니다.
편집: 오류 메시지 출력
2010-04-13 16:54:47 (128 KB/s) - `somewebsite.com/index.php?id=917218' saved [10789]
Removing somewebsite.com/index.php?id=917218 since it should be rejected.
홈페이지 출처는 밝히지 않겠습니다 :)
답변1
Hugh Allen이 지적했듯이 just를 사용하면 --accept=jpg
wget 로드가 발생합니다.오직확장자가 .jpg인 파일(항상 가져오는 .htm, .html) 이것이 wget이 PHP 파일을 제거할 것이라고 말하는 이유입니다. 그러니 --accept=jpg,php
비슷한 것을 사용해 보세요 .
참조wget 매뉴얼자세한 내용은. 전체 승인/거부 메커니즘을 매우 자세히 설명하므로 읽어 보시기 바랍니다.
답변2
어쩌면 --accept=jpg
다른 모든 것을 거부한다는 뜻일 수도 있습니다.