Como usar o wget para baixar o diretório recursivamente, no diretório com o mesmo nome do servidor?

Como usar o wget para baixar o diretório recursivamente, no diretório com o mesmo nome do servidor?

Digamos que eu tenha um URL assim:

https://mywebsite.com/files/myfolder

Como faço para baixar todos os arquivos dominha pastaparte (que é um diretório), excluindo arquivos como arquivos de índice, em um diretório com o mesmo nome?

Ou seja, eu quero acabar com um diretório no meucomputadorchamado myfolder com todo o conteúdo de myfolder noservidor.

Idealmente, eu gostaria de não precisar especificar o nome do diretório (no cliente) e apenas deixar o wget fazer o seu trabalho e copiá-lo do servidor. Como eu faço isso?

Responder1

Eu acredito que você pode querer usar --mirroro recurso do wget:

wget --no-clobber --mirror --convert-links --page-requisites --reject-regex 'index.html' "https://mywebsite.com/files/myfolder"

Ajuste a expressão regular para excluir todos os padrões de nomes de arquivos que você não deseja.

Editar: Droga, J363, você me venceu por um minuto.

Responder2

wget -v -m -np -c --no-check-certificate  "https://mywebsite.com/files/myfolder"  -O myfolder

O sinalizador -R pode ser usado para especificar os arquivos que você deseja rejeitar antecipadamente.

-R rejlist --reject rejlist Especifique listas separadas por vírgulas de sufixos ou padrões de nomes de arquivos para aceitar ou rejeitar. Observe que se algum dos caracteres curinga,, ?, [ ou ], aparecerem em um elemento de acclist ou rejlist, será tratado como um padrão, em vez de um sufixo. Nesse caso, você deve colocar o padrão entre aspas para evitar que seu shell o expanda, como em -A ".mp3" ou -A '*.mp3'.

informação relacionada