Codificación final de caracteres predeterminada en las versiones de Windows

Codificación final de caracteres predeterminada en las versiones de Windows

Sé que en Europa occidental y EE. UU., CP-1252 es la codificación de caracteres predeterminada.

¿Qué tal la codificación de caracteres predeterminada en otras versiones de Windows?

Además, recientemente escuché que Windows 8 usa UTF-8 como codificación de caracteres predeterminada, ¿es correcto?

Respuesta1

Windows utiliza intrínsecamente la codificación UTF-16. Las "codificaciones predeterminadas" o "páginas de códigos predeterminadas" en la terminología de Microsoft son simplemente codificaciones heredadas que utilizan muchos programas antiguos. Por ejemplo, en el Bloc de notas, la codificación predeterminada al guardar un archivo es "ANSI", que (de manera bastante engañosa) indica la página de códigos predeterminada (pero el Bloc de notas funciona internamente con UTF-16).

La configuración regional del sistema determina la página de códigos predeterminada. La páginaCódigos regionales de Windows: lista ordenablemuestra el mapeo y probablemente sea confiable. (No pude encontrar una página de Microsoft sobre esto).

En particular, los navegadores web tienden a utilizar la página de códigos predeterminada determinada como la codificación de una página web, si la información de codificación no está disponible. En realidad, es más complicado. En HTML5 LC, secciónDeterminar la codificación de caracteresdescribe (y prescribe) el proceso y también contiene una tabla de mapeo que refleja en gran medida las asignaciones de Windows desde configuraciones regionales a páginas de códigos.

información relacionada