오프라인으로 탐색할 수 있도록 웹사이트를 다운로드하려고 하므로 HTML, 이미지, CSS, 자바스크립트 등이 필요합니다.
문제는 CSS 및 자바스크립트와 마찬가지로 이미지가 모두 웹사이트와 동일한 도메인에서 호스팅되지 않는다는 것입니다. 이미지 중 일부는 imgur에서 가져온 것이고 다른 일부는 다른 파일 공유 사이트에서 가져온 것입니다. 즉, 이 사이트에서 사용하는 리소스를 보유한 도메인이 많이 있습니다.
단일 도메인에서 HTML을 다운로드하면서 해당 HTML이 사용하는 리소스를 모든 도메인에서 어떻게 얻을 수 있습니까?
답변1
인수 집합을 사용해야 합니다.호스트 스패닝:
주로:
-H
지정된 호스트 이외의 다른 호스트로 이동-D
포함할 도메인을 지정하려면--exclude-domains
제외할 도메인을 지정하려면
예를 들어:
wget -rH --exclude-domains flickr.com myownsite.com