Wget で必要なファイルを保存するのに問題があります - ディレクトリを除外しても機能しないようです

Question

はっ！やっと解決しました。include には、すべてのディレクトリのフルパスを含める必要がありますが、URL は含めないでください。

wget -r -A xls,xlsx,"" -l 2 -I /government/uploads/system/uploads/attachment_data/file/,/government/publications/,/government/collections/departmental-spend-over-500 https://www.gov.uk/government/collections/departmental-spend-over-500

明らかではない - 少なくとも私にとってはそうではない...

(コードボックスを右にスクロールするとすべて表示されます)

編集: 実際はもっと良いです - ここで分割しました:

wget -r -A xls,xlsx,"" -l 2 
-I /government/uploads/system/uploads/attachment_data/file/,
   /government/publications/,
   /government/collections/departmental-spend-over-500
https://www.gov.uk/government/collections/departmental-spend-over-500

ライン1：再帰的に、xls と xlsx および拡張子のないファイル (この場合は html ファイルなど) を含め、5 行目で指定された場所から 2 レベル実行します。

2行目～4行目:最上位の URL からこれらのパス/ディレクトリを含めます (つまり、他のすべてを除外します)

5行目:どこから始めるか

Answer 1