私は、自分のファイルシステム上にその正確なコピーを表示できるように、Blogger サイトをミラーリングしようとしています。Linux で次のコマンドを発行してみました。
wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.com/
-D フラグを使用して、コンマで区切られたフォローするドメインのリストを一覧表示することも試しました (ただし、すべてのドメインを指定する必要はなく、任意のドメインをフォローする方が望ましいです)。URL の .com 部分を自分の国のトップレベル ドメイン (.it) に変更することも試しました (これがないと、wget は index.html のみを取得し、他のページは取得しません。理由はわかりませんが、知りたいです。誰かここで理由を説明してくれるかもしれません)。
だから、私が
wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.it/
いくつかの HTML と favicon.ico はダウンロードされますが、blogger の .png 画像はダウンロードされません。なぜそうなるのでしょうか。また、wget を正常に動作させるにはどうすればよいのでしょうか。wget のマニュアル ページを読みましたが、うまくいきませんでした。
ありがとう。
答え1
提案されたようにjayhendren
、-D フラグに続くリストにドメイン bp.blogspot.com をリストしてみました。しかし、-H フラグを追加するのを忘れていました。wget で、-D フラグに続くドメインのリストとは別に、追加の -H フラグを追加する必要がある理由は私にはわかりませんが、うまくいきます。以下は、外部ドメインから提供される画像を含む Blogger サイトをミラーリングするために最終的に指定したコマンドです。
wget --domains=blogspot.it,bp.blogspot.com -H --mirror -e robots=off \
--wait 0.5 --convert-links http://yoursitehere.blogspot.it/
注: これはイタリアから機能します。自分の場所からこれを機能させたい場合は、.it を .com またはその他のトップレベル ドメインに変換してください。
よろしくお願いいたします。
答え2
wget のエラー出力がなければ、正確に何が問題なのかはわかりません。しかし、通常、wget を使用してダウンロード (または Web サイトのミラーリング) する場合は、次のように -mirror オプションを使用します。
wget --mirror -p --adjust-extension --wait 1 http://your.site.here.blogspot.it/