WGET 다운로드한 웹사이트가 제대로 작동하지 않습니다

WGET 다운로드한 웹사이트가 제대로 작동하지 않습니다

WGET을 사용하여 웹사이트를 다운로드했습니다. 다운로드 및 링크 변환 후 특정 리소스를 얻을 수 없습니다.

예를 들어 로 저장된 CSS 파일은 index.min.css?update=2로드되지 않습니다. 하지만 새 탭에서 링크를 열고 링크를 로 변경하면 index.min.css%3fupdate=2파일이 로드됩니다.

많은 파일이 이러한 패턴으로 저장됩니다. 이 문제를 어떻게 해결합니까?

답변1

웹사이트를 다운로드하는 것이 완벽한 경우는 거의 없습니다. 많은 경우 이후에도 수동 수정이 필요합니다.

일반적인 문제에 대한 몇 가지 조언:

  • wget 호출은 매개변수 --adjust-extension및 를 사용해야 합니다 --convert-links. 이 옵션은 --adjust-extensionwget이 PHP 파일을 확장명으로 저장하도록 하고 .html, --convert-linkswget이 다운로드한 파일의 링크를 새로 생성된 .html파일로 변환하도록 합니다(단, 모든 파일을 다운로드한 후에만 가능).

  • 파일 이름에 특수 문자가 포함된 경우 --restrict-file-names=nocontrol또는 를 사용할 수 있습니다 --restrict-file-names=ascii.

  • wget에서 문자 인코딩이 잘못되면 --remote-encoding로 지정할 수 있습니다 --remote-encoding=utf-8.

(이 목록은 결코 완전한 것이 아니며 귀하의 문제에 적용되지 않을 수도 있습니다.)

관련 정보