¿Cómo actualizar automáticamente el espejo de un sitio web con excepciones para determinadas páginas?

¿Cómo actualizar automáticamente el espejo de un sitio web con excepciones para determinadas páginas?

Actualmente estoy reflejando un sitio web en mi servidor. El sitio en sí rara vez se actualiza, pero se actualiza lo suficiente como para que la información quede obsoleta rápidamente.

Primero lo reflejé con wget y funcionó bien, pero hice algunos cambios:

  • El index.html original usaba marcos, pero el sitio también proporciona un main.html que es esencialmente index.html pero sin marcos. Eliminé index.html y cambié el nombre a main.html.
  • No quería reflejar el chat web, el blog o el foro, así que eliminé esos archivos y directorios y creé los directorios "blogs", "foro" y "chat" y coloqué una redirección de PHP en cada uno de ellos, redirigiendo a los visitantes al sitio original.

Me gustaría actualizar automáticamente el espejo (tal vez una vez cada 24 a 72 horas), pero conservar los cambios que hice. es posible? ¿Cómo haría para hacerlo? No tengo ni idea de cómo.

¡Gracias por cualquier y toda la ayuda! :)

Respuesta1

Supongo que estás usando wget --miror. Soluciones posibles:

  1. Si las secciones a conservar están en directorios, esto puede funcionar:

    wget --exclude-directories=LIST

  2. Si puede tolerarlo, permite la condición de carrera y puede dejar que wget sobrescriba cosas y luego las vuelva a sobrescribir con un script que las restaure.

  3. Evite la sobrescritura de los archivos que no desea cambiar.

    chmod 444 index.html

información relacionada