
wget을 사용하여 웹페이지에서 사용자 정의 n 수준까지 URL을 추출하려고 합니다. 나는 이것을 시도했다
wget -r -l$2 --reject=gif -O out.html www.google.com | sed -n 's/.*href="\([^"]*\).*/\1/p'` "
첫 번째 수준만 표시됩니다. 어떤 수준도 분석하지 않습니다. 어떻게 수정할 수 있나요?
답변1
변수 2=1 또는 이와 유사한 것을 다른 곳에 할당하지 않는 한 $2를 제거하십시오. -l$2로 인해 wget이 출력되어 wget: --level: Invalid number
sed에 잘 공급되지 않습니다.
넌 할 수있어:
wget -l 2 <address>
또는
wget --length=2 <address>
wget이 디렉토리(n 레벨) 위로 이동하는 것을 방지하는 no-parent 옵션에 관심이 있을 수도 있습니다. 이는 특정 계층 구조 아래의 파일만 다운로드되도록 보장하므로 재귀적으로 검색할 때 특히 유용한 옵션입니다.
wget -np <address>