wget ミラーサイト + 他のドメインからのリソース

wget ミラーサイト + 他のドメインからのリソース

オフラインで閲覧できるように Web サイトをダウンロードしようとしているので、HTML、画像、CSS、JavaScript などが必要です。

問題は、画像がすべてウェブサイトと同じドメインでホストされているわけではないことです。CSS や JavaScript も同様です。画像の一部は imgur から、その他は他のファイル共有サイトから取得されています。つまり、このサイトが使用するリソースを持つドメインは数多くあります。

単一のドメインから HTML をダウンロードし、その HTML で使用されるリソースを任意のドメインから取得するにはどうすればよいでしょうか?

答え1

一連の引数を使用する必要がありますホストスパニング:

主に:

  • -H指定されたホスト以外のホストに移動する
  • -D含めるドメインを指定する
  • --exclude-domains除外するドメインを指定する

例えば:

wget -rH --exclude-domains flickr.com myownsite.com

関連情報