我正在嘗試下載整個網站,wget
如下所示:
wget -r http://whatever/
wget -m http://whatever/
但它只下載帶有文字的頁面,沒有圖像。如何下載包含文字和圖像的頁面?我在這裡缺少什麼?
答案1
wget
您需要使用的命令要長得多,如下所述。因此,您可能希望將其提交到類似的文件wholesite.sh
,使其成為可執行文件,然後運行它。它將創建一個 url 目錄和網站資產的子目錄,包括圖像、js、css 等。
wget \
--recursive \
--level 5 \
--no-clobber \
--page-requisites \
--adjust-extension \
--span-hosts \
--convert-links \
--restrict-file-names=windows \
--domains yoursite.com \
--no-parent \
yoursite.com
解釋
--recursive
這指定了您要檢索的網站資源的子目錄數量(因為圖片等資源通常保存在網站的子目錄中)搜尋資源的預設最大深度為 5 個子目錄。您可以使用level
下面的標誌來修改它。
--level 5
在 5 個子目錄中搜尋資產。如果目標站點較大或較小,我建議分別增加或減少此值。
--no-clobber
不要覆蓋現有文件。
--page-requisites
導致wget
下載正確顯示給定 HTML 頁面所需的所有文件,其中包括圖片、css、js等
--adjust-extension
保留 .html、.css 和其他資源的正確檔案副檔名。
--span-hosts
也包括來自異地的必要資產。
--convert-links
更新網站連結以作為本機電腦上子目錄中的檔案工作(用於本機檢視)。
--restrict-file-names=windows
如果您在 Windows 系統上使用此命令,則修改檔案名稱也可以在 Windows 中使用。
--domains yoursite.com
請勿點擊該網域之外的連結。
--no-parent
不要點擊您傳入的目錄之外的連結。
yoursite.com
# 下載位址