如何使用wget下載資料夾中的所有文件

如何使用wget下載資料夾中的所有文件

我需要下載網域資料夾中的所有檔案https://example.com/folder/subfolder。子資料夾檔案沒有唯一增量,表示檔案名稱是隨機字串。我想使用 wget 或任何其他方法下載子資料夾中的所有檔案。請提供詳細資訊。

我嘗試了答案這裡。它只會下載index.html 檔案。我在該答案中使用 --reject 選項嘗試了其他選項,但它沒有下載任何內容。

答案1

據我所知,wget僅適用於以下連結:

  • 明確具有標準href屬性。

  • 存在於給定的 HTML 文件中(這是伺服器生成的內容,因此每個技術上可用文件可能不會總是列出以wget供下載)。

此外,您可能應該查看任何原始頁面來源(例如在您的瀏覽器中)。如果頁面使用 JavaScript,您可能會運氣不好,因為wget它不處理 JavaScript。

如果原始 HTML 中列出了鏈接,但沒有標準href屬性,您仍然可以解析頁面中的鏈接,只是不能使用wget.您可能需要使用 Windows PowerShell 或Python(可能與要求) 和美麗湯


請注意,在極少數情況下,如果連結完全由 JavaScript 生成,您甚至可能需要碳粉匣在處理文件連結之前保存完全渲染的頁面。 Python 有一個硒模組我個人在獨立的“Marmaduke”構建(zip 檔案)方面運氣不錯來自 Woolyss 的未穀歌搜尋的 Chromium用於瀏覽器自動化。

相關內容