如何使用 wget 下載整個網站(包括其圖像)

如何使用 wget 下載整個網站(包括其圖像)

我正在嘗試下載整個網站,wget如下所示:

wget -r http://whatever/

wget -m http://whatever/

但它只下載帶有文字的頁面,沒有圖像。如何下載包含文字和圖像的頁面?我在這裡缺少什麼?

答案1

wget您需要使用的命令要長得多,如下所述。因此,您可能希望將其提交到類似的文件wholesite.sh,使其成為可執行文件,然後運行它。它將創建一個 url 目錄和網站資產的子目錄,包括圖像、js、css 等。

wget \
     --recursive \
     --level 5 \
     --no-clobber \
     --page-requisites \
     --adjust-extension \
     --span-hosts \
     --convert-links \
     --restrict-file-names=windows \
     --domains yoursite.com \
     --no-parent \
         yoursite.com

解釋

--recursive 這指定了您要檢索的網站資源的子目錄數量(因為圖片等資源通常保存在網站的子目錄中)搜尋資源的預設最大深度為 5 個子目錄。您可以使用level下面的標誌來修改它。

--level 5在 5 個子目錄中搜尋資產。如果目標站點較大或較小,我建議分別增加或減少此值。

--no-clobber 不要覆蓋現有文件。

--page-requisites 導致wget下載正確顯示給定 HTML 頁面所需的所有文件,其中包括圖片、css、js等

--adjust-extension 保留 .html、.css 和其他資源的正確檔案副檔名。

--span-hosts 也包括來自異地的必要資產。

--convert-links 更新網站連結以作為本機電腦上子目錄中的檔案工作(用於本機檢視)。

--restrict-file-names=windows 如果您在 Windows 系統上使用此命令,則修改檔案名稱也可以在 Windows 中使用。

--domains yoursite.com 請勿點擊該網域之外的連結。

--no-parent 不要點擊您傳入的目錄之外的連結。

yoursite.com# 下載位址


範例改編自:https://gist.github.com/christiangenco/8531418

相關內容