Baixei um site usando WGET. Após o download e a conversão dos links, não consigo obter determinados recursos.
Por exemplo, um arquivo CSS salvo com index.min.css?update=2
não carrega. Mas se eu abrir o link em uma nova aba e alterar o link para index.min.css%3fupdate=2
, o arquivo será carregado.
Muitos arquivos são salvos nesse padrão. Como eu resolvo este problema?
Responder1
Baixar um site raramente é perfeito. Em muitos casos, a fixação manual ainda é necessária posteriormente.
Alguns conselhos para problemas comuns:
A chamada wget deve usar os parâmetros
--adjust-extension
e--convert-links
. A opção--adjust-extension
faz com que o wget salve os arquivos PHP com uma.html
extensão, enquanto--convert-links
faz com que o wget converta os links dos arquivos baixados para os.html
arquivos recém-criados (mas somente após o download de todos os arquivos).Quando os nomes dos arquivos contêm caracteres especiais, você pode usar
--restrict-file-names=nocontrol
ou--restrict-file-names=ascii
.Quando o wget erra na codificação de caracteres, você pode especificar
--remote-encoding
, como talvez--remote-encoding=utf-8
.
(Esta lista não é de forma alguma exaustiva e pode não se aplicar ao seu problema.)