Ich führe wget auf einer Site aus, die (wie ich festgestellt habe) zweisprachig ist – und für jede Sprache doppelte Seiten hat. Ich habe den Inhalt bereits auf Englisch, daher möchte ich wget daran hindern, noch mehr herunterzuladen. Ich habe beim Ausführen den Schalter -k angegeben. Werden die Links also wie üblich in relative Links umgewandelt, wenn ich wget stoppe, bevor es alles vollständig heruntergeladen hat? Oder wird es einfach angehalten?
(Es gibt eine weitere Frage im StackExchange-Netzwerk, die sich damit befasst, wie man wget zwingt, Links auf bereits heruntergeladenen Inhalten zu konvertieren, indem man
wget -nc -k [previous options] [previous url]
aber die Zeitstempel wurden versehentlich deaktiviert, daher ist das keine Option.)
Antwort1
NEIN.
Die Option -k wird erst angewendet, wenn der Download abgeschlossen ist.
Wenn wget abgebrochen wird (d. h. Strg+C), wird die Option -k nicht aufgerufen.
Sie können dies sehen, wenn wget abgeschlossen ist. Der letzte Schritt ist die Konvertierung der Links.
Am Ende wird angezeigt, wie viele HTML-Dateien konvertiert wurden. Deren Zeitstempel werden während dieses Vorgangs ebenfalls aktualisiert.
AKTUALISIEREN: Versuchen Sie, die Option -R zu verwenden, um Dateien in einer anderen Sprache auszuschließen. Dies funktioniert jedoch nur, wenn die Dateien etwas aufweisen, das sie einheitlich eindeutig macht.
Versuchen Sie zum Beispiel:
-R*_en*.htm*
Das würde Dateien ausschließen, die mit .htm oder .html enden und irgendwo im Pfad das _en haben. Ich verwende einen Unterstrich oder etwas, dasPufferder „en“-Teil, weil ich Dateien nicht ausschließen möchte, die einfach ein „en“ enthalten.
Dies funktioniert jedoch nur, wenn die Dateibenennung einheitlich ist.