
我正在嘗試使用 wget 從網頁中提取 URL,最多可達使用者定義的 n 個等級。我試過這個
wget -r -l$2 --reject=gif -O out.html www.google.com | sed -n 's/.*href="\([^"]*\).*/\1/p'` "
它僅顯示第一級。它沒有解析任何級別我該如何糾正它
答案1
除非你在其他地方分配變數 2=1 或類似的東西,否則去掉 $2 , -l$2 將導致 wget 輸出,wget: --level: Invalid number
而這不會很好地輸入 sed 。
你可以做:
wget -l 2 <address>
或者
wget --length=2 <address>
您可能也對無父選項感興趣,這將阻止 wget 向上遍歷目錄(n 層)。在遞歸檢索時,這是一個特別有用的選項,因為它保證只下載特定層次結構下的檔案。
wget -np <address>