
我需要在命令列中獲取一個網頁(單頁,不是所有網站)及其所有資產(圖像/css)。
我真的很喜歡 google chrome 的做法 - 如果我保存網頁,我會得到單個 html 檔案和包含所有資源的單一目錄。此外,所有圖像路徑都更改為本地路徑,並且所有連結都是絕對的(如果是“/pricing”,則變為“http://example.com/pricing”)。
我知道我可以用 做到這一點wget
,但我不喜歡結果 - 許多目錄(如果有來自不同域的圖像),並且 html 文件位於目錄中的某個位置(帶有域名)..
我真的很喜歡用谷歌瀏覽器保存頁面後的結果,我需要知道你是否知道一些可以產生類似結果的命令列爬蟲。
或者你知道如何配置wget
才能像我需要的那樣?
答案1
謝謝大家的建議!
我需要的是--no-directories
的參數wget
。然後我得到一個目錄,其中包含我需要的所有檔案(html 檔案、圖像、css 檔案)。
抱歉,這個問題沒有很好地表述。