Die Ausgabe von wget -r verstehen

Question

Sie können versuchen, Dateien mit der Option zu überspringen --reject(akzeptiert auch Platzhalter):

wget --reject index.html

Dies sollten Sie jedoch nicht tun. Wenn Sie wget mit verwenden -r, muss es irgendwie eine Liste der Dateien im Verzeichnis erhalten. Daher fragt wget nach der Datei index.html und analysiert den Inhalt in der Hoffnung, Pfade zu anderen Dateien in diesem Verzeichnis zu erhalten. Wenn sich im Ordner keine Datei index.html befindet, generiert der Webserver sie normalerweise für wget – diese Datei enthält die Verzeichnisliste. Die Erstellung dieser Listendatei muss auf dem Webserver aktiviert sein – andernfalls erhält wget eine HTTP 404-Antwort und der rekursive Download schlägt fehl.

Dies ist die Dateigröße in Bytes.
Das bedeutet, dass eine Datei nicht gelöscht werden konnte (wahrscheinlich, weil sie gar nicht erstellt wurde). Haben Sie Schreibrechte für das Verzeichnis, in das Sie mit wget herunterladen?

Bearbeiten:Nachdem ich die Downloads von wget mit getestet habe --spider, --recursive konnte ich Ihren Unlink-Fehler reproduzieren. Es scheint, dass wget den Inhaltstyp der Antwort verwendet, um zu bestimmen, ob die Datei Links zu anderen Ressourcen enthalten kann. Wenn der Inhaltstyptest fehlschlägt und die Datei nicht heruntergeladen wird, versucht wget trotzdem, die temporäre Datei zu entfernen, als ob sie heruntergeladen worden wäre (Dies wird deutlich, wenn wget erneut mit ausgeführt wird --debug. Es wird eindeutig angezeigt Removing file due to --spider in recursive_retrieve():). Ich vermute, Sie haben einen Fehler in wget gefunden.

Answer 1

Sie können versuchen, Dateien mit der Option zu überspringen --reject(akzeptiert auch Platzhalter):

wget --reject index.html

Dies sollten Sie jedoch nicht tun. Wenn Sie wget mit verwenden -r, muss es irgendwie eine Liste der Dateien im Verzeichnis erhalten. Daher fragt wget nach der Datei index.html und analysiert den Inhalt in der Hoffnung, Pfade zu anderen Dateien in diesem Verzeichnis zu erhalten. Wenn sich im Ordner keine Datei index.html befindet, generiert der Webserver sie normalerweise für wget – diese Datei enthält die Verzeichnisliste. Die Erstellung dieser Listendatei muss auf dem Webserver aktiviert sein – andernfalls erhält wget eine HTTP 404-Antwort und der rekursive Download schlägt fehl.

Dies ist die Dateigröße in Bytes.
Das bedeutet, dass eine Datei nicht gelöscht werden konnte (wahrscheinlich, weil sie gar nicht erstellt wurde). Haben Sie Schreibrechte für das Verzeichnis, in das Sie mit wget herunterladen?

Bearbeiten:Nachdem ich die Downloads von wget mit getestet habe --spider, --recursive konnte ich Ihren Unlink-Fehler reproduzieren. Es scheint, dass wget den Inhaltstyp der Antwort verwendet, um zu bestimmen, ob die Datei Links zu anderen Ressourcen enthalten kann. Wenn der Inhaltstyptest fehlschlägt und die Datei nicht heruntergeladen wird, versucht wget trotzdem, die temporäre Datei zu entfernen, als ob sie heruntergeladen worden wäre (Dies wird deutlich, wenn wget erneut mit ausgeführt wird --debug. Es wird eindeutig angezeigt Removing file due to --spider in recursive_retrieve():). Ich vermute, Sie haben einen Fehler in wget gefunden.

Die Ausgabe von wget -r verstehen

Antwort1

verwandte Informationen