La siguiente respuesta en Stack Overflow es famosa por su argumento convincente contra el uso de expresiones regulares para analizar HTML:https://stackoverflow.com/a/1732454/505154
El contenido de la publicación se corrompe cada vez más y el final debería mostrar algo como esto:
Sin embargo, en mi computadora portátil con Windows XP veo lo siguiente:
¿Cómo puedo hacer que estos "caracteres" se muestren correctamente?
Respuesta1
La forma más sencilla es descargar e instalar una fuente suficientemente grande, comosimboloy utiliza Firefox o Chrome.
El problema es doble. Primero, el texto contiene signos diacríticos combinados que no son compatibles con las fuentes enviadas con Win XP. Hay algunas fuentes gratuitas que puedes utilizar para solucionar este problema. En segundo lugar, IE tiene problemas para representar caracteres cuando ninguna fuente incluida en la font-family
lista aplicable cubre un carácter en un documento HTML. Chrome y Firefox hacen un trabajo mucho mejor; Incluso Firefox 3, que probé en un sistema virtual Windows XP, parece manejar bien la situación: recoge los caracteres faltantes de otras fuentes del sistema.
Además de páginas que juegan con la combinación de signos diacríticos de forma infantil, hay páginas reales que hacen uso de dichos signos. Por eso es bueno estar preparado. No existe una fuente única que cubra todos los caracteres, así que simplemente instale fuentes adicionales según sea necesario; Alan Wood tiene una bonita página paradescargando fuentescon amplios repertorios de personajes.
Respuesta2
Es más que sólo el conjunto de personajes.
Para mostrarlo correctamente, el cliente que representa el texto y cualquier biblioteca que utilice para ello debe admitir la combinación de marcas Unicode, además de tener las fuentes necesarias y soporte para unir fuentes para combinar fuentes según sea necesario.
Ipensarla fuente principal es Microsoft Sans Serif o Arial Unicode MS Regular, que viene de serie con cada versión de Windows y se ha actualizado ampliamente desde su lanzamiento inicial para XP, probablemente para incluir todas las marcas diacríticas Unicode que faltan aquí. Es posible que haya otras fuentes en juego aquí, que se utilizan para llenar los espacios en la fuente principal si le falta un signo diacrítico específico. No estoy seguro de las ramificaciones legales de descargar una copia de las fuentes actualizadas sin pagarlas (sin comprar Windows Vista, Windows 7 o Windows 8 para la computadora portátil).
Si el problema es la falta de soporte en la biblioteca de renderizado para combinar signos diacríticos, entonces ninguna cantidad de fuentes le ayudará a mostrar el texto correctamente. Su única opción será actualizar la aplicación y/o las bibliotecas que utiliza para representar texto.