Descargué un sitio web usando WGET. Después de la descarga y los enlaces convertidos, no puedo obtener ciertos recursos.
Por ejemplo, un archivo CSS guardado con index.min.css?update=2
no se carga. Pero si abro el enlace en una pestaña nueva y lo cambio a index.min.css%3fupdate=2
, el archivo se carga.
Muchos archivos se guardan con ese patrón. ¿Cómo soluciono este problema?
Respuesta1
La descarga de un sitio web rara vez es perfecta. En muchos casos, después es necesario realizar una fijación manual.
Algunos consejos para problemas comunes:
La llamada wget debe usar los parámetros
--adjust-extension
y--convert-links
. La opción--adjust-extension
hace que wget guarde los archivos PHP con una.html
extensión, mientras que--convert-links
convierte los enlaces de los archivos descargados a los.html
archivos recién creados (pero solo después de que se hayan descargado todos los archivos).Cuando los nombres de archivos contienen caracteres especiales, puede utilizar
--restrict-file-names=nocontrol
o--restrict-file-names=ascii
.Cuando wget se equivoca en la codificación de caracteres, puede especificar
--remote-encoding
, como quizás--remote-encoding=utf-8
.
(Esta lista no es de ninguna manera exhaustiva y es posible que no se aplique a su problema).