WGET을 사용하여 웹사이트를 다운로드했습니다. 다운로드 및 링크 변환 후 특정 리소스를 얻을 수 없습니다.
예를 들어 로 저장된 CSS 파일은 index.min.css?update=2
로드되지 않습니다. 하지만 새 탭에서 링크를 열고 링크를 로 변경하면 index.min.css%3fupdate=2
파일이 로드됩니다.
많은 파일이 이러한 패턴으로 저장됩니다. 이 문제를 어떻게 해결합니까?
답변1
웹사이트를 다운로드하는 것이 완벽한 경우는 거의 없습니다. 많은 경우 이후에도 수동 수정이 필요합니다.
일반적인 문제에 대한 몇 가지 조언:
wget 호출은 매개변수
--adjust-extension
및 를 사용해야 합니다--convert-links
. 이 옵션은--adjust-extension
wget이 PHP 파일을 확장명으로 저장하도록 하고.html
,--convert-links
wget이 다운로드한 파일의 링크를 새로 생성된.html
파일로 변환하도록 합니다(단, 모든 파일을 다운로드한 후에만 가능).파일 이름에 특수 문자가 포함된 경우
--restrict-file-names=nocontrol
또는 를 사용할 수 있습니다--restrict-file-names=ascii
.wget에서 문자 인코딩이 잘못되면
--remote-encoding
로 지정할 수 있습니다--remote-encoding=utf-8
.
(이 목록은 결코 완전한 것이 아니며 귀하의 문제에 적용되지 않을 수도 있습니다.)