Codificação final de caracteres padrão nas versões do Windows

Codificação final de caracteres padrão nas versões do Windows

Eu sei que na Europa Ocidental e nos EUA, CP-1252 é a codificação de caracteres padrão.

Que tal a codificação de caracteres padrão em outras versões do Windows?

Além disso, ouvi recentemente que o Windows 8 usa UTF-8 como codificação de caracteres padrão, correto?

Responder1

O Windows usa intrinsecamente a codificação UTF-16. As “codificações padrão” ou “páginas de código padrão” na terminologia da Microsoft são apenas codificações legadas usadas por muitos programas antigos. Por exemplo, no Bloco de Notas, a codificação padrão ao salvar um arquivo é “ANSI”, que (de forma bastante enganosa) denota a página de código padrão (mas o Bloco de Notas funciona internamente com UTF-16).

A localidade do sistema determina a página de códigos padrão. A páginaCódigos de localidade do Windows - lista classificávelmostra o mapeamento e provavelmente é confiável. (Não consegui encontrar uma página da Microsoft sobre isso.)

Em particular, os navegadores da web tendem a usar a página de código padrão determinada como a codificação de uma página da web, se as informações de codificação não estiverem disponíveis. Na realidade, é mais complicado. No HTML5 LC, seçãoDeterminando a codificação de caracteresdescreve (e prescreve) o processo e também contém uma tabela de mapeamento que reflete amplamente os mapeamentos do Windows de localidades para páginas de código.

informação relacionada