オフラインで閲覧できるように Web サイトをダウンロードしようとしているので、HTML、画像、CSS、JavaScript などが必要です。
問題は、画像がすべてウェブサイトと同じドメインでホストされているわけではないことです。CSS や JavaScript も同様です。画像の一部は imgur から、その他は他のファイル共有サイトから取得されています。つまり、このサイトが使用するリソースを持つドメインは数多くあります。
単一のドメインから HTML をダウンロードし、その HTML で使用されるリソースを任意のドメインから取得するにはどうすればよいでしょうか?
答え1
一連の引数を使用する必要がありますホストスパニング:
主に:
-H
指定されたホスト以外のホストに移動する-D
含めるドメインを指定する--exclude-domains
除外するドメインを指定する
例えば:
wget -rH --exclude-domains flickr.com myownsite.com