wget 可以*列印*頁面依賴項 URL 嗎?

wget 可以*列印*頁面依賴項 URL 嗎?

作為一個可能的解決方法另一個問題,是否有可能使wget 列印它在目標文件中找到的 URL它認為是頁面必需條件嗎?我寧願不為我正在處理的簡單任務建立抓取程式碼。

答案1

你可以這樣做:

wget -nv -p -nd --delete-after <url>

這將輸出類似的內容:

2017-06-01 21:37:41 URL:<url> [19101] -> "index.html.3" [1]
2017-06-01 21:37:42 URL:<url>robots.txt [24/24] -> "robots.txt" [1]
2017-06-01 21:37:42 URL:<url>rc/1502.css [19106/19106] -> "1502.css" [1]
2017-06-01 21:37:42 URL:<url>favicon.ico [5390/5390] -> "favicon.ico" [1]
2017-06-01 21:37:42 URL:<url>avatar/nopic.jpg [893/893] -> "nopic.jpg

可以將其快速轉換或過濾為可能適合您需求的內容。

相關內容