Wget 無法從 Blogger 下載 PNG 文件

Wget 無法從 Blogger 下載 PNG 文件

我正在嘗試鏡像部落格網站,以便我可以在我的檔案系統上擁有它的精確副本以供查看。我嘗試在 Linux 上發出以下命令:

wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.com/

我什至嘗試使用 -D 標誌來列出要遵循的以逗號分隔的域列表(寧願只遵循任何域,但不必指定所有域)。我什至嘗試將 URL 的 .com 部分更改為我所在國家/地區的頂級域 (.it)(如果沒有它,由於某種原因我不明白並且想知道,wget 僅檢索 index.html 而不是其他頁面,也許這裡有人可以解釋原因)。

所以,即使我做了一個

wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.it/

下載了幾個 HTML 和 favicon.ico,但沒有下載來自部落格的 .png 映像。為什麼會這樣以及如何讓 wget 正常工作。我已經閱讀了 wget 手冊頁,但沒有運氣。

謝謝。

答案1

如所jayhendren建議的,我嘗試在 -D 標誌後面的清單中列出網域 bp.blogspot.com。然而我忘記做的是添加 -H 標誌。我不清楚為什麼 wget 需要從網域列表中單獨添加額外的 -H 標誌,然後再跟上 -D 標誌,但它確實有效。以下是我最終指定的用於鏡像 Blogger 網站(包括從外部網域提供的影像)的命令:

wget --domains=blogspot.it,bp.blogspot.com -H --mirror -e robots=off \
  --wait 0.5 --convert-links http://yoursitehere.blogspot.it/

注意:這適用於義大利。如果您希望此功能在您所在的位置運行,請將 .it 轉換為 .com 或任何其他頂級網域。

問候。

答案2

如果沒有 wget 的錯誤輸出,我無法判斷您遇到的確切問題是什麼。但通常在使用 wget 下載(或鏡像網站)時,我會使用 -mirror 選項,如下所示:

wget --mirror -p --adjust-extension --wait 1 http://your.site.here.blogspot.it/

相關內容