Wget が Blogger から PNG ファイルをダウンロードできない

Wget が Blogger から PNG ファイルをダウンロードできない

私は、自分のファイルシステム上にその正確なコピーを表示できるように、Blogger サイトをミラーリングしようとしています。Linux で次のコマンドを発行してみました。

wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.com/

-D フラグを使用して、コンマで区切られたフォローするドメインのリストを一覧表示することも試しました (ただし、すべてのドメインを指定する必要はなく、任意のドメインをフォローする方が望ましいです)。URL の .com 部分を自分の国のトップレベル ドメイン (.it) に変更することも試しました (これがないと、wget は index.html のみを取得し、他のページは取得しません。理由はわかりませんが、知りたいです。誰かここで理由を説明してくれるかもしれません)。

だから、私が

wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.it/

いくつかの HTML と favicon.ico はダウンロードされますが、blogger の .png 画像はダウンロードされません。なぜそうなるのでしょうか。また、wget を正常に動作させるにはどうすればよいのでしょうか。wget のマニュアル ページを読みましたが、うまくいきませんでした。

ありがとう。

答え1

提案されたようにjayhendren、-D フラグに続くリストにドメイン bp.blogspot.com をリストしてみました。しかし、-H フラグを追加するのを忘れていました。wget で、-D フラグに続くドメインのリストとは別に、追加の -H フラグを追加する必要がある理由は私にはわかりませんが、うまくいきます。以下は、外部ドメインから提供される画像を含む Blogger サイトをミラーリングするために最終的に指定したコマンドです。

wget --domains=blogspot.it,bp.blogspot.com -H --mirror -e robots=off \
  --wait 0.5 --convert-links http://yoursitehere.blogspot.it/

注: これはイタリアから機能します。自分の場所からこれを機能させたい場合は、.it を .com またはその他のトップレベル ドメインに変換してください。

よろしくお願いいたします。

答え2

wget のエラー出力がなければ、正確に何が問題なのかはわかりません。しかし、通常、wget を使用してダウンロード (または Web サイトのミラーリング) する場合は、次のように -mirror オプションを使用します。

wget --mirror -p --adjust-extension --wait 1 http://your.site.here.blogspot.it/

関連情報