
Ich stehe vor dem Dilemma, ob ich eine Javascript-Datei bearbeiten soll oder nicht. Wenn ich sie mit gedit öffne, wird die folgende Warnung angezeigt:
Die von Ihnen geöffnete Datei enthält einige ungültige Zeichen. Wenn Sie die Datei weiter bearbeiten, könnte das Dokument beschädigt werden. Sie können auch eine andere Zeichenkodierung wählen und es erneut versuchen.
Die aktuelle Kodierung ist UTF-8. Da die Datei über 100.000 Codezeilen enthält, gibt es eine schnelle Möglichkeit, nach ungültigen Zeichen zu suchen?
Antwort1
Da die Datei UTF-8 ist, können Sie sie ausführenisutf8. Ein zusätzliches Hilfspaket. Es gibt Ihnen sowohl Zeilen- als auch Zeichenangaben und den Offset für fehlerhafte Bytes.
Verwenden Sie dann zur Analyse xxd, Hexdump oder ähnliches.
Leider stoppt es beim ersten Absturz. Aber es hängt auch von der Datei ab. Es kann sein, dass nur ein fehlerhaftes Byte vorhanden ist ;)
Habe C-Code, der eine ähnliche Analyse durchführt, aber für die gesamte Datei. Er liegt irgendwo auf einer längst vergessenen Festplatte. Könnte versuchen, ihn bei Bedarf zu finden.
Sonst ja, die schnelle und nichtDasDie schmutzigste Methode wäre, einen Diff-Vorgang zwischen einer mit gedit gespeicherten Kopie durchzuführen – wie vom guten Herrn vorgeschlagen.@vonbrand.