我需要下載網域資料夾中的所有檔案https://example.com/folder/subfolder
。子資料夾檔案沒有唯一增量,表示檔案名稱是隨機字串。我想使用 wget 或任何其他方法下載子資料夾中的所有檔案。請提供詳細資訊。
我嘗試了答案這裡。它只會下載index.html 檔案。我在該答案中使用 --reject 選項嘗試了其他選項,但它沒有下載任何內容。
答案1
據我所知,wget
僅適用於以下連結:
明確具有標準
href
屬性。存在於給定的 HTML 文件中(這是伺服器生成的內容,因此每個技術上可用文件可能不會總是列出以
wget
供下載)。
此外,您可能應該查看任何原始頁面來源(例如在您的瀏覽器中)。如果頁面使用 JavaScript,您可能會運氣不好,因為wget
它不處理 JavaScript。
如果原始 HTML 中列出了鏈接,但沒有標準href
屬性,您仍然可以解析頁面中的鏈接,只是不能使用wget
.您可能需要使用 Windows PowerShell 或Python(可能與要求) 和美麗湯。
請注意,在極少數情況下,如果連結完全由 JavaScript 生成,您甚至可能需要碳粉匣在處理文件連結之前保存完全渲染的頁面。 Python 有一個硒模組我個人在獨立的“Marmaduke”構建(zip 檔案)方面運氣不錯來自 Woolyss 的未穀歌搜尋的 Chromium用於瀏覽器自動化。