wget을 사용하여 최대 n 레벨까지 웹페이지를 구문 분석합니다.

wget을 사용하여 최대 n 레벨까지 웹페이지를 구문 분석합니다.

wget을 사용하여 웹페이지에서 사용자 정의 n 수준까지 URL을 추출하려고 합니다. 나는 이것을 시도했다

 wget -r -l$2 --reject=gif -O out.html www.google.com | sed -n 's/.*href="\([^"]*\).*/\1/p'` "

첫 번째 수준만 표시됩니다. 어떤 수준도 분석하지 않습니다. 어떻게 수정할 수 있나요?

답변1

변수 2=1 또는 이와 유사한 것을 다른 곳에 할당하지 않는 한 $2를 제거하십시오. -l$2로 인해 wget이 출력되어 wget: --level: Invalid number sed에 잘 공급되지 않습니다.

넌 할 수있어:

wget -l 2 <address>

또는

wget --length=2 <address>

wget이 디렉토리(n 레벨) 위로 이동하는 것을 방지하는 no-parent 옵션에 관심이 있을 수도 있습니다. 이는 특정 계층 구조 아래의 파일만 다운로드되도록 보장하므로 재귀적으로 검색할 때 특히 유용한 옵션입니다.

wget -np <address>

관련 정보