wget зеркало сайта + ресурсы с другого домена

wget зеркало сайта + ресурсы с другого домена

Я пытаюсь загрузить веб-сайт, чтобы его можно было просматривать офлайн, поэтому мне нужны HTML, изображения, CSS, JavaScript и т. д.

Проблема в том, что не все изображения размещены на том же домене, что и веб-сайт, то же самое касается css и javascript. Некоторые изображения взяты с imgur, другие с других файлообменных сайтов. Короче говоря, есть много доменов, которые имеют ресурсы, используемые этим сайтом.

Как я могу загрузить HTML-файл с одного домена, но получить ресурсы, используемые этим HTML-файлом, с любого домена?

решение1

Вам следует использовать набор аргументов дляхост-охват:

В основном:

  • -Hдля перехода на другие хосты, чем указанные
  • -Dуказать домены, которые будут включены
  • --exclude-domainsуказать домены, которые следует исключить

Например:

wget -rH --exclude-domains flickr.com myownsite.com

Связанный контент