
Я знаю, что в Западной Европе и США кодировкой символов по умолчанию является CP-1252.
А как насчет кодировки символов по умолчанию в других версиях Windows?
Кроме того, недавно я узнал, что Windows 8 использует UTF-8 в качестве кодировки символов по умолчанию. Это правильно?
решение1
Windows по своей сути использует кодировку UTF-16. «Кодировки по умолчанию» или «кодовые страницы по умолчанию» в терминологии Microsoft — это просто устаревшие кодировки, которые используются многими старыми программами. Например, в Блокноте кодировка по умолчанию при сохранении файла — «ANSI», что (довольно обманчиво) обозначает кодовую страницу по умолчанию (но Блокнот внутренне работает с UTF-16).
Системная локаль определяет кодовую страницу по умолчанию. СтраницаКоды локалей Windows — сортируемый списокпоказывает сопоставление и, вероятно, является достоверным. (Я не смог найти страницу Microsoft по этому вопросу.)
В частности, веб-браузеры, как правило, используют кодовую страницу по умолчанию, определенную как кодировка веб-страницы, если информация о кодировке недоступна. В реальности все сложнее. В HTML5 LC, разделОпределение кодировки символовописывает (и предписывает) этот процесс, а также содержит таблицу сопоставления, которая в значительной степени отражает сопоставления Windows между локалями и кодовыми страницами.