Estou tentando fazer backup do site de um clube em um NAS. Aqui está uma versão simplificada do script que estou usando, que ilustra o que está acontecendo (sem se aprofundar muito ou acessar conteúdo protegido):
cd /volume1/Backup/
wget -EkKrNpH \
--output-file=wget.log \
--domains=imcz.club,sf.wildapricot.org \
--exclude-domains=webmail.imcz.club \
--exclude-directories=calendar,Club-Events,External-Events,Sys \
--ignore-case \
--level=1 \
--no-parent \
--no-proxy \
--random-wait \
--reject=ashx,"overlay*" \
--reject-regex="calendar[@\?].*|Club-Events[@\?].*|External-Events[@\?].*|event-\d+[@\?].*" \
--rejected-log=wget-rejected.log \
--restrict-file-names=windows \
--wait=1 \
https://imcz.club/
Quando eu executo ele, os seguintes diretórios são criados:
imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/fonts
imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/Fonts_ADMIN_Jun-01-132914-2021_Conflict
imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/Fonts_ADMIN_Jun-01-132917-2021_Conflict
imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/Fonts_ADMIN_Jun-01-132919-2021_Conflict
Já que estou usando -r e --ignore-casesem--no-clobber, eu esperava que o conteúdo de todos esses diretórios fosse colocado em:
imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/fonts
No entanto, apenas o primeiro arquivo de fonte encontrado vai parar lá, conforme mostrado neste trecho do arquivo de log:
--2021-06-01 13:28:33-- https://imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/fonts/fontawesome-webfont.woff
Connecting to imcz.club|34.226.77.200|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 98024 (96K) [application/x-woff]
Saving to: 'imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/fonts/fontawesome-webfont.woff'
2021-06-01 13:28:34 (233 KB/s) - 'imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/fonts/fontawesome-webfont.woff' saved [98024/98024]
Os arquivos de fontes encontrados posteriormente acabam nos diretórios que terminam em "_Conflict". Aqui está um exemplo de trecho do arquivo de log:
--2021-06-01 13:29:12-- https://imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/Fonts/opensans-italic-webfont.woff
Connecting to imcz.club|34.226.77.200|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 23188 (23K) [application/x-woff]
Saving to: 'imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/Fonts/opensans-italic-webfont.woff'
Eu tentaria usar --debug para entender isso melhor, mas a versão wget no meu NAS foi construída sem suporte para depuração. O site está em uma plataforma SAAS, portanto não tenho controle sobre o uso inconsistente de maiúsculas e minúsculas no endereçamento do diretório de fontes. Em um navegador, qualquer uma das fontes pode ser baixada de:
imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/fonts
ou:
imcz.club/BuiltTheme/whiteboard_maya_blue.v3.0/1e3b357e/Fonts
Como solução alternativa, tentei preencher previamente o diretório local de "fontes" com todas as fontes, esperando que a opção -r ignorasse o download delas. Contudo, os diretórios "_Conflict" foram criados de qualquer maneira. Isso poderia ser uma consequência de --convert-links? O que estou fazendo de errado ou o que entendi mal?