Como atualizar automaticamente um espelho de site com exceções para determinadas páginas?

Como atualizar automaticamente um espelho de site com exceções para determinadas páginas?

Atualmente estou espelhando um site no meu servidor. O site em si raramente é atualizado, mas é atualizado o suficiente para que as informações possam ficar desatualizadas rapidamente.

Eu espelhei primeiro com o wget e funcionou bem, mas fiz algumas alterações:

  • O index.html original usava frames, mas o site também fornece um main.html que é essencialmente index.html, mas sem frames. Excluí index.html e renomeei main.html.
  • Eu não queria espelhar o webchat, blog ou fórum, então apaguei esses arquivos e diretórios e criei diretórios "blogs", "fórum" e "chat" e coloquei um redirecionamento php em cada um deles, redirecionando os visitantes para o site original.

Gostaria de atualizar automaticamente o espelho (talvez uma vez a cada 24-72 horas), mas preservar as alterações que fiz. Isso é possível? Como eu faria isso? Estou completamente sem noção de como.

Obrigado por toda e qualquer ajuda! :)

Responder1

Presumo que você esteja usando wget --miror. Soluções possíveis:

  1. Se as seções a serem preservadas estiverem em diretórios, isso poderá funcionar:

    wget --exclude-directories=LIST

  2. Se você puder tolerar isso, você permite a condição de corrida, você pode deixar o wget sobrescrever as coisas e então sobrescrevê-las de volta com um script que as restaura.

  3. Evite a substituição dos arquivos que você não deseja alterar.

    chmod 444 index.html

informação relacionada