
Ich habe eine ISO-8859-Datei, die ich in UTF-8 konvertieren muss:
file *
test.csv: ISO-8859 text, with very long lines, with CRLF line terminators
Jetzt verwende ich die iconv.exe für Windows wie folgt:
iconv.exe -f iso-8859-1 -t utf-8//TRANSLIT test.csv > conv.csv
Das Problem besteht darin, dass ich jetzt seltsame Zeichen sehe, wo lateinische Zeichen vorkommen (z. B. à, ì, ...), und beim Überprüfen stellt sich heraus, dass diese stattdessen in UTF-16 konvertiert wurden!
file *
test.csv: ISO-8859 text, with very long lines, with CRLF line terminators
conv.csv: Little-endian UTF-16 Unicode text, with very long lines, with CRLF, CR line terminators
Warum ist das so? Wie kann ich das einfache UTF-8 erreichen?