Wget tendo problemas apenas para salvar os arquivos que desejo - excluir diretórios não parece funcionar

Question

Ha! Finalmente resolvi. Na inclusão você deve incluir o caminho completo para todos os diretórios - mas NÃO o URL:

wget -r -A xls,xlsx,"" -l 2 -I /government/uploads/system/uploads/attachment_data/file/,/government/publications/,/government/collections/departmental-spend-over-500 https://www.gov.uk/government/collections/departmental-spend-over-500

Não é óbvio - bem, não para mim, de qualquer maneira...

(role para a direita na caixa de código para ver tudo)

Editar: Na verdade melhor - eu dividi aqui:

wget -r -A xls,xlsx,"" -l 2 
-I /government/uploads/system/uploads/attachment_data/file/,
   /government/publications/,
   /government/collections/departmental-spend-over-500
https://www.gov.uk/government/collections/departmental-spend-over-500

Linha 1:recursivo, inclui arquivos xls e xlsx e que não possuem extensões (- neste caso arquivos html...) e executa dois níveis a partir de onde especificado na linha 5

Linhas 2-4:inclua esses caminhos/diretórios do URL superior (ou seja, exclua todo o resto)

Linha 5:por onde começar

Answer 1