Standardmäßige Zeichenendkodierung in Windows-Versionen

Standardmäßige Zeichenendkodierung in Windows-Versionen

Ich weiß, dass in Westeuropa und den USA CP-1252 die Standardzeichenkodierung ist.

Wie steht es mit der Standardzeichenkodierung in anderen Windows-Versionen?

Außerdem habe ich kürzlich gehört, dass Windows 8 UTF-8 als Standardzeichenkodierung verwendet. Ist das richtig?

Antwort1

Windows verwendet grundsätzlich die UTF-16-Kodierung. Die „Standardkodierungen“ oder „Standardcodepages“ in der Microsoft-Terminologie sind lediglich veraltete Kodierungen, die von vielen alten Programmen verwendet werden. Beispielsweise ist in Notepad die Standardkodierung beim Speichern einer Datei „ANSI“, was (ziemlich irreführend) die Standardcodepage bezeichnet (aber Notepad arbeitet intern mit UTF-16).

Die Standard-Codepage wird durch das Systemgebietsschema bestimmt.Windows-Gebietsschemacodes - Sortierbare Listezeigt die Zuordnung und ist wahrscheinlich zuverlässig. (Ich konnte keine Microsoft-Seite dazu finden.)

Insbesondere neigen Webbrowser dazu, die so festgelegte Standard-Codepage als Kodierung einer Webseite zu verwenden, wenn keine Kodierungsinformationen verfügbar sind. In Wirklichkeit ist es komplizierter. In HTML5 LC, AbschnittFestlegen der Zeichenkodierungbeschreibt (und schreibt) den Prozess vor und enthält außerdem eine Zuordnungstabelle, die im Wesentlichen die Windows-Zuordnungen von Gebietsschemas zu Codepages widerspiegelt.

verwandte Informationen