wget 미러 사이트 + 다른 도메인의 리소스

wget 미러 사이트 + 다른 도메인의 리소스

오프라인으로 탐색할 수 있도록 웹사이트를 다운로드하려고 하므로 HTML, 이미지, CSS, 자바스크립트 등이 필요합니다.

문제는 CSS 및 자바스크립트와 마찬가지로 이미지가 모두 웹사이트와 동일한 도메인에서 호스팅되지 않는다는 것입니다. 이미지 중 일부는 imgur에서 가져온 것이고 다른 일부는 다른 파일 공유 사이트에서 가져온 것입니다. 즉, 이 사이트에서 사용하는 리소스를 보유한 도메인이 많이 있습니다.

단일 도메인에서 HTML을 다운로드하면서 해당 HTML이 사용하는 리소스를 모든 도메인에서 어떻게 얻을 수 있습니까?

답변1

인수 집합을 사용해야 합니다.호스트 스패닝:

주로:

  • -H지정된 호스트 이외의 다른 호스트로 이동
  • -D포함할 도메인을 지정하려면
  • --exclude-domains제외할 도메인을 지정하려면

예를 들어:

wget -rH --exclude-domains flickr.com myownsite.com

관련 정보