특정 페이지를 제외하고 웹사이트 미러를 자동 업데이트하는 방법은 무엇입니까?

특정 페이지를 제외하고 웹사이트 미러를 자동 업데이트하는 방법은 무엇입니까?

현재 내 서버에서 웹사이트를 미러링하고 있습니다. 사이트 자체는 거의 업데이트되지 않지만 정보가 빨리 구식이 될 수 있을 정도로 업데이트됩니다.

먼저 wget으로 미러링했는데 잘 작동했지만 몇 가지 사항을 변경했습니다.

  • 원래 index.html은 프레임을 사용했지만 사이트에서는 기본적으로 index.html이지만 프레임이 없는 main.html도 제공합니다. index.html을 삭제하고 main.html로 이름을 바꿨습니다.
  • 나는 웹 채팅, 블로그 또는 포럼을 미러링하고 싶지 않았기 때문에 해당 파일과 디렉터리를 삭제하고 "블로그" "포럼" 및 "채팅" 디렉터리를 만든 다음 각각에 PHP 리디렉션을 배치하여 방문자를 원래 사이트로 리디렉션했습니다.

미러를 자동으로 업데이트하고 싶지만(아마도 24~72시간마다 한 번씩) 제가 변경한 내용은 그대로 유지됩니다. 이것이 가능한가? 어떻게 하면 될까요? 나는 방법에 대해 완전히 단서가 없습니다.

모든 도움에 감사드립니다! :)

답변1

을 사용하고 있다고 가정합니다 wget --miror. 가능한 해결책:

  1. 보존할 섹션이 디렉터리에 있으면 다음과 같이 작동할 수 있습니다.

    wget --exclude-directories=LIST

  2. 이를 허용할 수 있다면 경쟁 조건을 허용하고 wget이 항목을 덮어쓰게 한 다음 이를 복원하는 스크립트로 다시 덮어쓸 수 있습니다.

  3. 변경하지 않으려는 파일을 덮어쓰는 것을 방지합니다.

    chmod 444 index.html

관련 정보