¿Por qué el carácter Unicode (U+2295) aparece como (U+2248)?

¿Por qué el carácter Unicode (U+2295) aparece como (U+2248)?

Abro el Bloc de notas y luego escribo +2295manteniendo presionada la tecla Alt, luego suelto la tecla Alt. Guardo el archivo con codificación Unicode. Sin embargo, la salida no eshttp://www.fileformat.info/info/unicode/char/2295/index.htmcomo se esperaba, pero estohttp://www.fileformat.info/info/unicode/char/2248/index.htmen cambio. ¿Qué estoy haciendo mal? Buscando algunos consejos.

Para cualquier otra persona que tenga problemas con esto: tenga en cuenta EnableHexNumpadque debe haber una nuevaTipo de cadena(Consulte la página Wiki vinculada en la respuesta)

Respuesta1

Elentrada de wikipediaen los métodos de entrada Unicode enumera un requisito previo necesario para que esto funcione:

Un requisito previo para este método de entrada es que la clave de registro HKEY_CURRENT_USER\Control Panel\Input Methodcontenga un valor de tipo cadena ( REG_SZ) llamado EnableHexNumpad, que tenga los datos del valor 1. Los usuarios deben cerrar sesión o iniciar sesión en Windows 8.1/8.0, Windows 7 y Vista o reiniciar en sistemas anteriores después de editar el registro para que este método de entrada comience a funcionar.

Después de agregar esta clave de registro en mi máquina y reiniciar, la entrada funciona tal como se anuncia.

Respuesta2

Para responder a la pregunta de por qué está presente este valor específico:

Con el método de entrada estándar, los números decimales se toman mod 256 y luego se interpretan como la página de códigos OEM* si no hay un cero a la izquierda, o la página de códigos ANSI si hay un cero a la izquierda. Entonces, los pasos son:

  • 2295 módulo 256 = 247
  • 247 [0xF7] es U+2295 en la página de códigos OEM

Los conjuntos de caracteres que tienen U+2295 en esta poción son las páginas de códigos 437, 737, 770, 772, 774, 860, 861, 862, 863, 864, 865, CWI y MIK.

(El hecho de que "2295" y "2248" comiencen con 22 es una coincidencia interesante, nada más)

* Nota: La "página de códigos ANSI" tiene poco que ver con ANSI, excepto que la página de códigos 1252 se basó en un borrador de lo que luego se convirtió en ISO 8859-1 [y algunos de los otros tenían orígenes similares]. Es el juego de caracteres de 8 bits asociado con la configuración regional actual y la "página de códigos OEM" es otro juego de caracteres asociado con la configuración regional, generalmente el que se usó en MS-DOS en ese país.

información relacionada