我正在嘗試下載網站,以便可以離線瀏覽,所以我想要 html、圖像、css、javascript 等。
問題是圖像並不都託管在與網站相同的網域中,CSS 和 JavaScript 也是如此。一些圖像來自 imgur,其他圖像來自其他文件共享網站。簡而言之,有很多網域擁有該網站使用的資源。
如何從單一網域下載 html,但從任何網域取得該 html 使用的資源?
答案1
您應該使用一組參數主機跨越:
主要是:
-H
遍歷到指定主機以外的其他主機-D
指定要包含的網域--exclude-domains
指定要排除的網域
例如:
wget -rH --exclude-domains flickr.com myownsite.com