El sitio web descargado de WGET no funciona correctamente

El sitio web descargado de WGET no funciona correctamente

Descargué un sitio web usando WGET. Después de la descarga y los enlaces convertidos, no puedo obtener ciertos recursos.

Por ejemplo, un archivo CSS guardado con index.min.css?update=2no se carga. Pero si abro el enlace en una pestaña nueva y lo cambio a index.min.css%3fupdate=2, el archivo se carga.

Muchos archivos se guardan con ese patrón. ¿Cómo soluciono este problema?

Respuesta1

La descarga de un sitio web rara vez es perfecta. En muchos casos, después es necesario realizar una fijación manual.

Algunos consejos para problemas comunes:

  • La llamada wget debe usar los parámetros --adjust-extensiony --convert-links. La opción --adjust-extensionhace que wget guarde los archivos PHP con una .htmlextensión, mientras que --convert-linksconvierte los enlaces de los archivos descargados a los .htmlarchivos recién creados (pero solo después de que se hayan descargado todos los archivos).

  • Cuando los nombres de archivos contienen caracteres especiales, puede utilizar --restrict-file-names=nocontrolo --restrict-file-names=ascii.

  • Cuando wget se equivoca en la codificación de caracteres, puede especificar --remote-encoding, como quizás --remote-encoding=utf-8.

(Esta lista no es de ninguna manera exhaustiva y es posible que no se aplique a su problema).

información relacionada