
Ich habe einen ausgeführt wget -b
. Aus dem Protokoll habe ich versucht, die Liste der erfolgreich heruntergeladenen Dateien abzurufen. Dazu habe ich einen ausgeführt, grep saved wget-log | awk -F '"' '{print $2}'
aber es hat nicht funktioniert. Bei weiteren Untersuchungen fiel mir auf, dass der Dateiname in 3-Byte-Anführungszeichen links und rechts (0xE2 0x80 0x9D) statt in normalen Anführungszeichen (0x22) eingeschlossen ist.
Ist das das normale Verhalten von wget oder ist es eine Umgebungsvariable auf meiner Seite oder so etwas in der Art? Kann ich wget irgendwie dazu bringen, normale Anführungszeichen zu verwenden oder nur Standard-ASCII-Bytes in seiner Protokollierung zu verwenden? Ich kenne andere Möglichkeiten, dies zu umgehen, indem man die Bytes beispielsweise durch sed ersetzt. Das fasziniert mich einfach sehr: Ich habe mehrere Minuten bei Google nach Kommentaren dazu gesucht und konnte nichts finden, es ist, als ob das noch nie jemandem aufgefallen wäre.
Antwort1
Scheint in Unicode-Gebietsschemas beabsichtigt zu sein. Es gibt einen Kommentar dazu aufwgets Mailingliste. Die Sprachübersetzungsdateien enthalten auch Übersetzungen für Zitate, sodass Sie entsprechend der verwendeten Sprache „richtige“ Zitate erhalten.
Sie können die Verwendung normaler Anführungszeichen einstellen, indem Sie ein Nicht-Unicode-Gebietsschema verwenden.
LC_ALL=C wget ...
oder
LC_CTYPE=C wget ...