Wget erstellt keine Indexdatei des Verzeichnisses

Question 1

Dies funktioniert möglicherweise nicht in jedem Fall, aber ich konnte dieses Problem mit einem etwas unerwarteten Tag lösen.

Aus dem wget 1.17.1-Handbuch:

‘-E’

‘--adjust-extension’

Wenn eine Datei vom Typ ‘application/xhtml+xml’oder ‘text/html’heruntergeladen wird und die URL nicht mit dem regulären Ausdruck endet ‘\.[Hh][Tt][Mm][Ll]?’, bewirkt diese Option, dass das Suffix ‘.html’an den lokalen Dateinamen angehängt wird.

Wenn wget in Ihrem Fall den Link findet http://example.com/direction, prüft es, ob die Seite HTML-formatiert ist. Wenn ja, wird sie auf der lokalen Festplatte als gespeichert /example.com/direction.html. Wenn es dann sieht http://example.com/direction/11, wird es sie auf der Festplatte als speichern /example.com/direction/11und somit die erste Datei nicht überschreiben. Vorausgesetzt, die tatsächliche Verzeichnisstruktur ist /example.com/direction/index.html, wird sie nicht genau mit der Remote-Verzeichnisstruktur übereinstimmen, aber zumindest werden keine Dateien fälschlicherweise überschrieben.

Answer

Dies funktioniert möglicherweise nicht in jedem Fall, aber ich konnte dieses Problem mit einem etwas unerwarteten Tag lösen.

Aus dem wget 1.17.1-Handbuch:

‘-E’

‘--adjust-extension’

Wenn eine Datei vom Typ ‘application/xhtml+xml’oder ‘text/html’heruntergeladen wird und die URL nicht mit dem regulären Ausdruck endet ‘\.[Hh][Tt][Mm][Ll]?’, bewirkt diese Option, dass das Suffix ‘.html’an den lokalen Dateinamen angehängt wird.

Wenn wget in Ihrem Fall den Link findet http://example.com/direction, prüft es, ob die Seite HTML-formatiert ist. Wenn ja, wird sie auf der lokalen Festplatte als gespeichert /example.com/direction.html. Wenn es dann sieht http://example.com/direction/11, wird es sie auf der Festplatte als speichern /example.com/direction/11und somit die erste Datei nicht überschreiben. Vorausgesetzt, die tatsächliche Verzeichnisstruktur ist /example.com/direction/index.html, wird sie nicht genau mit der Remote-Verzeichnisstruktur übereinstimmen, aber zumindest werden keine Dateien fälschlicherweise überschrieben.

Question 2

Eine Lösung dieses Problems nur mit Wget ist nahezu unmöglich. Lassen Sie mich zunächst versuchen, Ihnen das Problem zu erklären.

Zuerst versucht Wget, herunterzuladen http://site.com/direction. Wenn Wget eine Anfrage für diesen Pfad sendet, antwortet der Server mit den in verfügbaren Daten http://site/com/example/index.html. Zu diesem Zeitpunkt ist Wget jedoch nicht bewusst, dass die an ihn gesendeten Daten dem Pfad „example/index.html“ entsprechen. Wenn Wget nun eine andere Datei findet, http://site.com/example/11passiert dasselbe erneut. Allerdings muss es zuerst das Verzeichnis „example/“ erstellen und löscht dazu unbedingt die alte Datei. Meiner Meinung nach sollte Wget erkennen, ob es eine Datei durch ein Verzeichnis ersetzt, und die Datei als Indexdatei speichern. Aber das tut es derzeit nicht.

Answer

Eine Lösung dieses Problems nur mit Wget ist nahezu unmöglich. Lassen Sie mich zunächst versuchen, Ihnen das Problem zu erklären.

Zuerst versucht Wget, herunterzuladen http://site.com/direction. Wenn Wget eine Anfrage für diesen Pfad sendet, antwortet der Server mit den in verfügbaren Daten http://site/com/example/index.html. Zu diesem Zeitpunkt ist Wget jedoch nicht bewusst, dass die an ihn gesendeten Daten dem Pfad „example/index.html“ entsprechen. Wenn Wget nun eine andere Datei findet, http://site.com/example/11passiert dasselbe erneut. Allerdings muss es zuerst das Verzeichnis „example/“ erstellen und löscht dazu unbedingt die alte Datei. Meiner Meinung nach sollte Wget erkennen, ob es eine Datei durch ein Verzeichnis ersetzt, und die Datei als Indexdatei speichern. Aber das tut es derzeit nicht.

Wget erstellt keine Indexdatei des Verzeichnisses

Antwort1

Antwort2

verwandte Informationen