wget鏡像網站+其他網域的資源

wget鏡像網站+其他網域的資源

我正在嘗試下載網站,以便可以離線瀏覽,所以我想要 html、圖像、css、javascript 等。

問題是圖像並不都託管在與網站相同的網域中,CSS 和 JavaScript 也是如此。一些圖像來自 imgur,其他圖像來自其他文件共享網站。簡而言之,有很多網域擁有該網站使用的資源。

如何從單一網域下載 html,但從任何網域取得該 html 使用的資源?

答案1

您應該使用一組參數主機跨越:

主要是:

  • -H遍歷到指定主機以外的其他主機
  • -D指定要包含的網域
  • --exclude-domains指定要排除的網域

例如:

wget -rH --exclude-domains flickr.com myownsite.com

相關內容