¿Cómo obtener el código Unicode y el nombre del símbolo para algunos caracteres en un archivo PDF?

¿Cómo obtener el código Unicode y el nombre del símbolo para algunos caracteres en un archivo PDF?

Tengo un archivo PDF con algunos caracteres Unicode (ver imagen).

ingrese la descripción de la imagen aquí

Puedo copiar estos caracteres al portapapeles e insertarlos, por ejemplo, en MS Word y veo el carácter como un solo cuadrado con un signo de interrogación, probablemente porque falta la fuente respectiva en mi sistema.

Lo que quiero es obtener el código del carácter en UTF y su nombre. ¿Cómo puedo conseguirlos? Estos son los personajes que me interesan. ¿Quizás uno pueda reconocerlos directamente? De todos modos, una solución general para PDF y Unicode sería genial.

Respuesta1

En MS Word, coloque el cursor justo después de un carácter e ingrese Alt X (es decir, presione la tecla X mientras mantiene presionada la tecla Alt). En cualquier versión razonablemente moderna de Word, esto convierte el carácter en su número de código Unicode. Para obtener el nombre, puede visitarhttp://www.unicode.orgo utilizar el programa Character Map en Windows, por ejemplo. O podrías instalarBabelPad, un excelente editor Unicode que muestra el número Unicode y el nombre Unicode de cada carácter a medida que mueve el cursor justo delante de él.

Alternativa, tal vez para más diversión, puedes usarhttp://shapecatcher.com/y dibuja el personaje. Para patrones simples, es bastante efectivo. Inmediatamente reconoció que su primer personaje es “Cuadrado blanco con cuadrante superior derecho” U+25F3, de mi dibujo bastante torpe.

información relacionada