wget이 재귀 모드에서 작동하지 않습니다

Question 1

aol.com/index.html모든 링크가 다른 호스트를 가리키기 때문에 문제가 발생합니다 . 모든 호스트에서 반복적으로 다운로드하려면 옵션을 추가할 수 있습니다 --span-hosts. 모든 AOL 호스트를 허용하려면 옵션을 추가하는 것이 효과적인 것 같았습니다 --span-hosts '*.aol.com'.

wget --span-hosts '*.aol.com' -r http://www.aol.com

다음을 사용하여 링크를 나열할 수 있습니다.

grep -Po '(?<=href=")[^"]*' aol.com/index.html

대부분이 www.aol.com을 가리키고 있으므로 전화를 걸어도 됩니다.

wget -r http://www.aol.com

Answer

aol.com/index.html모든 링크가 다른 호스트를 가리키기 때문에 문제가 발생합니다 . 모든 호스트에서 반복적으로 다운로드하려면 옵션을 추가할 수 있습니다 --span-hosts. 모든 AOL 호스트를 허용하려면 옵션을 추가하는 것이 효과적인 것 같았습니다 --span-hosts '*.aol.com'.

wget --span-hosts '*.aol.com' -r http://www.aol.com

다음을 사용하여 링크를 나열할 수 있습니다.

grep -Po '(?<=href=")[^"]*' aol.com/index.html

대부분이 www.aol.com을 가리키고 있으므로 전화를 걸어도 됩니다.

wget -r http://www.aol.com

Question 2

다음을 사용하면 wget웹사이트에 연결된 모든 페이지를 재귀적으로 다운로드할 수 있습니다.

wget -r $(curl http://aol.com | grep -Po '(?<=href=")[^"]*')

예제 웹사이트를 원하는 웹사이트로 바꾸세요. 이것은 다음과 같이 가져옵니다Deapth for search in a graph

일하는 방식 curl을(를) 가져올 것입니다 index.html. grep일치하여 모든 링크를 찾기 위해 파이프로 연결됩니다 href. 입력 결과는 wget변수로 제공됩니다 . wget변수에서 링크를 하나씩 가져옵니다.

Answer

다음을 사용하면 wget웹사이트에 연결된 모든 페이지를 재귀적으로 다운로드할 수 있습니다.

wget -r $(curl http://aol.com | grep -Po '(?<=href=")[^"]*')

예제 웹사이트를 원하는 웹사이트로 바꾸세요. 이것은 다음과 같이 가져옵니다Deapth for search in a graph

일하는 방식 curl을(를) 가져올 것입니다 index.html. grep일치하여 모든 링크를 찾기 위해 파이프로 연결됩니다 href. 입력 결과는 wget변수로 제공됩니다 . wget변수에서 링크를 하나씩 가져옵니다.

wget이 재귀 모드에서 작동하지 않습니다

답변1

답변2

관련 정보