Wget hat Probleme, nur die gewünschten Dateien zu speichern - das Ausschließen von Verzeichnissen scheint nicht zu funktionieren

Question

Ha! Endlich habe ich es hinbekommen. Im Include muss der vollständige Pfad aller Verzeichnisse angegeben werden - aber NICHT die URL:

wget -r -A xls,xlsx,"" -l 2 -I /government/uploads/system/uploads/attachment_data/file/,/government/publications/,/government/collections/departmental-spend-over-500 https://www.gov.uk/government/collections/departmental-spend-over-500

Nicht offensichtlich – also zumindest nicht für mich …

(scrollen Sie im Codefeld nach rechts, um alles anzuzeigen)

Edit: Eigentlich besser - ich habe es hier aufgeteilt:

wget -r -A xls,xlsx,"" -l 2 
-I /government/uploads/system/uploads/attachment_data/file/,
   /government/publications/,
   /government/collections/departmental-spend-over-500
https://www.gov.uk/government/collections/departmental-spend-over-500

Linie 1:rekursiv, schließe xls & xlsx & Dateien ein, die keine Erweiterungen haben (- in diesem Fall HTML-Dateien...) und führe zwei Ebenen ab der in Zeile 5 angegebenen Stelle aus

Zeilen 2-4:diese Pfade/Verzeichnisse ab der obersten URL einschließen (also alles andere ausschließen)

Zeile 5:Wo soll ich anfangen?

Answer 1