Я пытаюсь загрузить веб-сайт, чтобы его можно было просматривать офлайн, поэтому мне нужны HTML, изображения, CSS, JavaScript и т. д.
Проблема в том, что не все изображения размещены на том же домене, что и веб-сайт, то же самое касается css и javascript. Некоторые изображения взяты с imgur, другие с других файлообменных сайтов. Короче говоря, есть много доменов, которые имеют ресурсы, используемые этим сайтом.
Как я могу загрузить HTML-файл с одного домена, но получить ресурсы, используемые этим HTML-файлом, с любого домена?
решение1
Вам следует использовать набор аргументов дляхост-охват:
В основном:
-H
для перехода на другие хосты, чем указанные-D
указать домены, которые будут включены--exclude-domains
указать домены, которые следует исключить
Например:
wget -rH --exclude-domains flickr.com myownsite.com