Wget kann PNG-Dateien nicht von Blogger herunterladen

Wget kann PNG-Dateien nicht von Blogger herunterladen

Ich versuche, eine Blogger-Site zu spiegeln, damit ich eine exakte Kopie davon auf meinem Dateisystem habe, um sie anzuzeigen. Ich habe versucht, den folgenden Befehl unter Linux einzugeben:

wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.com/

Ich habe sogar versucht, mit dem Flag -D eine durch Kommas getrennte Liste der zu verfolgenden Domänen aufzulisten (ich würde jedoch lieber jeder beliebigen Domäne folgen, ohne sie alle angeben zu müssen). Ich habe sogar versucht, den .com-Teil der URL in die Top-Level-Domäne meines Landes (.it) zu ändern (ohne die wget aus irgendeinem Grund, den ich nicht verstehe und den ich gerne wissen würde, nur index.html und keine andere Seite abruft, vielleicht kann hier jemand erklären, warum).

Selbst wenn ich also

wget -r -k -x -e robots=off --wait 1 http://your.site.here.blogspot.it/

Es werden mehrere HTML-Dateien und auch die Favicon.ico-Datei heruntergeladen, aber keine der PNG-Bilder von Blogger. Warum ist das so und wie kann ich wget dazu bringen, richtig zu funktionieren? Ich habe die Manpage von wget gelesen, aber hatte kein Glück.

Danke.

Antwort1

Wie jayhendrenvorgeschlagen, habe ich versucht, die Domain bp.blogspot.com in der Liste nach dem Flag -D aufzulisten. Ich habe jedoch vergessen, das Flag -H hinzuzufügen. Warum wget verlangt, dass das zusätzliche Flag -H separat von der Liste der Domains hinzugefügt wird, denen das Flag -D folgt, ist mir nicht klar, aber es funktioniert. Hier ist der Befehl, den ich letztendlich angegeben habe, um die Blogger-Site einschließlich der von der externen Domain bereitgestellten Bilder zu spiegeln:

wget --domains=blogspot.it,bp.blogspot.com -H --mirror -e robots=off \
  --wait 0.5 --convert-links http://yoursitehere.blogspot.it/

Hinweis: Dies funktioniert von Italien aus. Konvertieren Sie .it in .com oder eine andere Top-Level-Domain, wenn dies von Ihrem Standort aus funktionieren soll.

Grüße.

Antwort2

Ohne die Fehlerausgabe von wget kann ich nicht sagen, was genau Ihr Problem ist. Aber im Allgemeinen verwende ich beim Herunterladen (oder Spiegeln einer Website) mit wget die Option -mirror wie folgt:

wget --mirror -p --adjust-extension --wait 1 http://your.site.here.blogspot.it/

verwandte Informationen