Como obter o código Unicode e o nome do símbolo para alguns caracteres em um arquivo PDF?

Como obter o código Unicode e o nome do símbolo para alguns caracteres em um arquivo PDF?

Tenho um arquivo PDF com alguns caracteres Unicode (veja a imagem).

insira a descrição da imagem aqui

Posso copiar esses caracteres para a área de transferência e inseri-los, por exemplo, no MS Word e vejo o caractere como um único quadrado com um ponto de interrogação, provavelmente porque a respectiva fonte está faltando no meu sistema.

O que eu quero é pegar o código do caractere em UTF e seu nome. Como posso obtê-los? Aqui estão os personagens nos quais estou interessado - talvez alguém possa reconhecê-los diretamente? De qualquer forma, uma solução geral para PDF e Unicode seria ótima.

Responder1

No MS Word, coloque o cursor logo após um caractere e digite Alt X (ou seja, pressione a tecla X enquanto mantém a tecla Alt pressionada). Em qualquer versão razoavelmente moderna do Word, isso transforma o caractere em seu número de código Unicode. Para obter o nome, você pode visitarhttp://www.unicode.orgou use o programa Character Map no Windows, por exemplo. Ou você pode instalarBabelPad, um ótimo editor Unicode que mostra o número Unicode e o nome Unicode de cada caractere conforme você move o cursor antes dele.

Alternativa, talvez para mais diversão, você pode usarhttp://shapecatcher.com/e desenhe o personagem. Para padrões simples, é bastante eficaz. Ele imediatamente reconheceu que seu primeiro caractere é “Quadrado branco com quadrante superior direito” U+25F3, do meu desenho um tanto desajeitado.

informação relacionada