Как автоматически обновить зеркало сайта, исключив определенные страницы?

Как автоматически обновить зеркало сайта, исключив определенные страницы?

Я сейчас делаю зеркало веб-сайта на своем сервере. Сам сайт обновляется редко, но он обновляется достаточно часто, так что информация может быстро устареть.

Сначала я создал зеркало с помощью wget, и это сработало нормально, но я внес некоторые изменения:

  • Оригинальный index.html использовал фреймы, но сайт также предоставляет main.html, который по сути является index.html, но без фреймов. Я удалил index.html и переименовал main.html.
  • Я не хотел дублировать веб-чат, блог или форум, поэтому удалил эти файлы и каталоги, создал каталоги «блоги», «форум» и «чат» и разместил в каждом из них PHP-редирект, перенаправляя посетителей на исходный сайт.

Я хотел бы автоматически обновлять зеркало (возможно, раз в 24-72 часа), но при этом сохранять внесенные мной изменения. Возможно ли это? Как мне это сделать? Я совершенно не представляю, как это сделать.

Спасибо за любую помощь! :)

решение1

Я предполагаю, что вы используете wget --miror. Возможные решения:

  1. Если разделы, которые необходимо сохранить, находятся в каталогах, это может сработать:

    wget --exclude-directories=LIST

  2. Если вы можете это выдержать и допустить состояние гонки, вы можете позволить wget перезаписать данные, а затем перезаписать их обратно с помощью скрипта, который их восстанавливает.

  3. Предотвратите перезапись файлов, которые вы не хотите изменять.

    chmod 444 index.html

Связанный контент