
私はwgetを使ってウェブページからユーザー定義のnレベルまでのURLを抽出しようとしています。私はこれを試しました
wget -r -l$2 --reject=gif -O out.html www.google.com | sed -n 's/.*href="\([^"]*\).*/\1/p'` "
最初のレベルのみが表示されています。どのレベルも解析されていません。どうすれば修正できますか?
答え1
変数 2=1 またはそれに類するものを他の場所で割り当てる場合を除いて、$2 を削除してください。-l$2 により、wget は出力しますが、wget: --level: Invalid number
これは sed にうまく入力されません。
できるよ:
wget -l 2 <address>
または
wget --length=2 <address>
また、親なしオプションにも興味があるかもしれません。このオプションは、wget がディレクトリ (n レベル) を上方向に走査するのを防ぎます。このオプションは、特定の階層の下のファイルのみがダウンロードされることを保証するため、再帰的に取得するときに特に便利なオプションです。
wget -np <address>