
Digamos que eu tenha um URL assim:
https://mywebsite.com/files/myfolder
Como faço para baixar todos os arquivos dominha pastaparte (que é um diretório), excluindo arquivos como arquivos de índice, em um diretório com o mesmo nome?
Ou seja, eu quero acabar com um diretório no meucomputadorchamado myfolder com todo o conteúdo de myfolder noservidor.
Idealmente, eu gostaria de não precisar especificar o nome do diretório (no cliente) e apenas deixar o wget fazer o seu trabalho e copiá-lo do servidor. Como eu faço isso?
Responder1
Eu acredito que você pode querer usar --mirror
o recurso do wget:
wget --no-clobber --mirror --convert-links --page-requisites --reject-regex 'index.html' "https://mywebsite.com/files/myfolder"
Ajuste a expressão regular para excluir todos os padrões de nomes de arquivos que você não deseja.
Editar: Droga, J363, você me venceu por um minuto.
Responder2
wget -v -m -np -c --no-check-certificate "https://mywebsite.com/files/myfolder" -O myfolder
O sinalizador -R pode ser usado para especificar os arquivos que você deseja rejeitar antecipadamente.
-R rejlist --reject rejlist Especifique listas separadas por vírgulas de sufixos ou padrões de nomes de arquivos para aceitar ou rejeitar. Observe que se algum dos caracteres curinga,, ?, [ ou ], aparecerem em um elemento de acclist ou rejlist, será tratado como um padrão, em vez de um sufixo. Nesse caso, você deve colocar o padrão entre aspas para evitar que seu shell o expanda, como em -A ".mp3" ou -A '*.mp3'.