Ich habe eine Website mit WGET heruntergeladen. Nach dem Download und der Konvertierung der Links kann ich auf bestimmte Ressourcen nicht zugreifen.
Beispielsweise index.min.css?update=2
wird eine mit gespeicherte CSS-Datei nicht geladen. Wenn ich den Link jedoch in einem neuen Tab öffne und den Link in ändere index.min.css%3fupdate=2
, wird die Datei geladen.
Viele Dateien werden in einem solchen Muster gespeichert. Wie löse ich dieses Problem?
Antwort1
Der Download einer Webseite ist nur sehr selten perfekt. In vielen Fällen ist im Nachhinein noch eine manuelle Korrektur erforderlich.
Einige Ratschläge für häufige Probleme:
Der wget-Aufruf sollte die Parameter
--adjust-extension
und verwenden--convert-links
. Die Option--adjust-extension
bewirkt, dass wget die PHP-Dateien mit einer Erweiterung speichert.html
, während--convert-links
wget die Links in den heruntergeladenen Dateien in die neu erstellten Dateien umwandelt.html
(aber erst, nachdem alle Dateien heruntergeladen wurden).Wenn Dateinamen Sonderzeichen enthalten, können Sie
--restrict-file-names=nocontrol
oder verwenden--restrict-file-names=ascii
.Wenn wget die Zeichenkodierung falsch erkennt, können Sie angeben
--remote-encoding
, beispielsweise--remote-encoding=utf-8
.
(Diese Liste ist keineswegs vollständig und trifft möglicherweise nicht auf Ihr Problem zu.)