使用 wget 解析網頁至 n 層

使用 wget 解析網頁至 n 層

我正在嘗試使用 wget 從網頁中提取 URL,最多可達使用者定義的 n 個等級。我試過這個

 wget -r -l$2 --reject=gif -O out.html www.google.com | sed -n 's/.*href="\([^"]*\).*/\1/p'` "

它僅顯示第一級。它沒有解析任何級別我該如何糾正它

答案1

除非你在其他地方分配變數 2=1 或類似的東西,否則去掉 $2 , -l$2 將導致 wget 輸出,wget: --level: Invalid number 而這不會很好地輸入 sed 。

你可以做:

wget -l 2 <address>

或者

wget --length=2 <address>

您可能也對無父選項感興趣,這將阻止 wget 向上遍歷目錄(n 層)。在遞歸檢索時,這是一個特別有用的選項,因為它保證只下載特定層次結構下的檔案。

wget -np <address>

相關內容