wget を使用してウェブページを n レベルまで解析する

wget を使用してウェブページを n レベルまで解析する

私はwgetを使ってウェブページからユーザー定義のnレベルまでのURLを抽出しようとしています。私はこれを試しました

 wget -r -l$2 --reject=gif -O out.html www.google.com | sed -n 's/.*href="\([^"]*\).*/\1/p'` "

最初のレベルのみが表示されています。どのレベルも解析されていません。どうすれば修正できますか?

答え1

変数 2=1 またはそれに類するものを他の場所で割り当てる場合を除いて、$2 を削除してください。-l$2 により、wget は出力しますが、wget: --level: Invalid number これは sed にうまく入力されません。

できるよ:

wget -l 2 <address>

または

wget --length=2 <address>

また、親なしオプションにも興味があるかもしれません。このオプションは、wget がディレクトリ (n レベル) を上方向に走査するのを防ぎます。このオプションは、特定の階層の下のファイルのみがダウンロードされることを保証するため、再帰的に取得するときに特に便利なオプションです。

wget -np <address>

関連情報