Я пытаюсь создать зеркало сайта Blogger, чтобы иметь точную копию в своей файловой системе для просмотра. Я попытался выполнить следующую команду в Linux:
wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.com/
Я даже пробовал использовать флаг -D, чтобы перечислить разделенный запятыми список доменов для подписки (хотя я бы предпочел просто подписаться на любой домен, не указывая их все). Я даже пробовал изменить часть .com URL на домен верхнего уровня для моей страны (.it) (без которого по какой-то причине, которую я не понимаю и хотел бы знать, wget извлекает только index.html и никакую другую страницу, возможно, кто-то здесь сможет объяснить, почему).
Поэтому, даже когда я делаю
wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.it/
Несколько HTML, а также favicon.ico загружаются, но ни одно из изображений .png из blogger не загружается. Почему это так и как мне заставить wget работать правильно. Я прочитал страницу руководства wget, но безуспешно.
Спасибо.
решение1
Как и jayhendren
предполагалось, я попытался указать домен bp.blogspot.com в списке после флага -D. Однако я забыл добавить флаг -H. Почему wget требует, чтобы дополнительный флаг -H был добавлен отдельно от списка доменов, следующих за флагом -D, мне неясно, но это работает. Вот команда, которую я в конечном итоге указал для зеркалирования сайта Blogger, включая изображения, обслуживаемые с внешнего домена:
wget --domains=blogspot.it,bp.blogspot.com -H --mirror -e robots=off \
--wait 0.5 --convert-links http://yoursitehere.blogspot.it/
Примечание: это работает из Италии. Конвертируйте .it в .com или в любой другой домен верхнего уровня, если вы хотите, чтобы это работало из вашего местоположения.
С уважением.
решение2
Без вывода ошибок wget я не могу сказать, в чем именно проблема. Но обычно при загрузке (или зеркалировании веб-сайта) с помощью wget я использую опцию -mirror следующим образом:
wget --mirror -p --adjust-extension --wait 1 http://your.site.here.blogspot.it/