理解 wget -r 輸出

Question

您可以嘗試使用選項跳過檔案--reject（也接受通配符）：

wget --拒絕index.html

然而你不想這樣做。當使用 wget 時-r，它需要以某種方式取得目錄內的檔案清單。因此，wget 請求index.html 檔案並解析內容，希望取得該目錄中其他檔案的路徑。當資料夾中沒有 index.html 檔案時，網頁伺服器通常會為 wget 產生它 - 該檔案將包含目錄清單。必須在網頁伺服器上啟用此清單檔案的建立 - 否則 wget 將收到 HTTP 404 回覆並因遞歸下載而失敗。

這是檔案大小（以位元組為單位）。
這意味著無法刪除檔案（可能是因為它不是首先創建的）。您對使用 wget 下載的目錄有寫入權限嗎？

編輯：在測試 wget 下載後--spider，--recursive 我重現了您的取消連結錯誤。看來 wget 使用回應的內容類型來決定檔案是否可以包含指向其他資源的連結。如果內容類型測試失敗且未下載文件，wget 仍將嘗試刪除臨時文件，就像已下載該文件一樣（這在使用重新運行 wget 時很明顯--debug。它將清楚地說明Removing file due to --spider in recursive_retrieve():）。我猜你已經發現了 wget 中的一個錯誤。

Answer 1

您可以嘗試使用選項跳過檔案--reject（也接受通配符）：

wget --拒絕index.html

然而你不想這樣做。當使用 wget 時-r，它需要以某種方式取得目錄內的檔案清單。因此，wget 請求index.html 檔案並解析內容，希望取得該目錄中其他檔案的路徑。當資料夾中沒有 index.html 檔案時，網頁伺服器通常會為 wget 產生它 - 該檔案將包含目錄清單。必須在網頁伺服器上啟用此清單檔案的建立 - 否則 wget 將收到 HTTP 404 回覆並因遞歸下載而失敗。

這是檔案大小（以位元組為單位）。
這意味著無法刪除檔案（可能是因為它不是首先創建的）。您對使用 wget 下載的目錄有寫入權限嗎？

編輯：在測試 wget 下載後--spider，--recursive 我重現了您的取消連結錯誤。看來 wget 使用回應的內容類型來決定檔案是否可以包含指向其他資源的連結。如果內容類型測試失敗且未下載文件，wget 仍將嘗試刪除臨時文件，就像已下載該文件一樣（這在使用重新運行 wget 時很明顯--debug。它將清楚地說明Removing file due to --spider in recursive_retrieve():）。我猜你已經發現了 wget 中的一個錯誤。

理解 wget -r 輸出

答案1

相關內容