나는 내 파일 시스템에서 블로거 사이트의 정확한 복사본을 볼 수 있도록 미러링하려고 합니다. Linux에서 다음 명령을 실행해 보았습니다.
wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.com/
나는 -D 플래그를 사용하여 따라야 할 도메인의 쉼표로 구분된 목록을 나열하려고 시도했습니다(모든 도메인을 지정하지 않고도 도메인을 따르는 것이 더 좋습니다). URL의 .com 부분을 내 국가의 최상위 도메인(.it)으로 변경하려고 시도했습니다. 어떤 이유로든 이해하지 못하고 알고 싶습니다. wget은 index.html만 검색하고 검색하지 않습니다. 다른 페이지에서는 아마도 여기 누군가가 이유를 설명할 수 있을 것입니다).
그래서 내가 할 때에도
wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.it/
여러 HTML과 favicon.ico도 다운로드되지만 블로거의 .png 이미지는 다운로드되지 않습니다. 왜 그런 것이며 어떻게 하면 wget이 제대로 작동하도록 할 수 있습니까? wget 매뉴얼 페이지를 읽었지만 운이 없었습니다.
감사해요.
답변1
제안된 대로 jayhendren
-D 플래그 다음에 오는 목록에 도메인 bp.blogspot.com을 나열해 보았습니다. 그러나 내가 잊어버린 것은 -H 플래그를 추가하는 것입니다. wget에서 -D 플래그를 따르는 도메인 목록과 별도로 추가 -H 플래그를 추가해야 하는 이유는 확실하지 않지만 작동합니다. 다음은 외부 도메인에서 제공되는 이미지를 포함하여 Blogger 사이트를 미러링하기 위해 최종적으로 지정한 명령입니다.
wget --domains=blogspot.it,bp.blogspot.com -H --mirror -e robots=off \
--wait 0.5 --convert-links http://yoursitehere.blogspot.it/
참고: 이는 이탈리아에서 작동합니다. 귀하의 위치에서 작동하도록 하려면 .it을 .com 또는 다른 최상위 도메인으로 변환하세요.
문안 인사.
답변2
wget의 오류 출력이 없으면 정확한 문제가 무엇인지 알 수 없습니다. 그러나 일반적으로 wget을 사용하여 다운로드(또는 웹사이트 미러링)할 때 다음과 같이 -mirror 옵션을 사용합니다.
wget --mirror -p --adjust-extension --wait 1 http://your.site.here.blogspot.it/