Hífen convertido em 'caractere desconhecido' quando colado em programas como Putty, Notepad está OK

Hífen convertido em 'caractere desconhecido' quando colado em programas como Putty, Notepad está OK

Quando um hífen codificado em UTF-8 (U+2010) é copiado de um navegador (tentei Firefox e IE) e depois colado em programas como Putty e Vim (as variantes do Windows), todos os hífens são mostrados como 'glifos desconhecidos' . Colar no Bloco de Notas funciona perfeitamente. Copiar/colar no Debian/wheezy do mesmo texto HTML (copiar do iceweasel, colar no vim) também funciona conforme o esperado.

Mas o caractere utf-8 não está prejudicado. Salvando no disco resp. copiar e colar o texto danificado funciona conforme planejado.

O verdadeiro problema que tenho que resolver é o Confluence e sua função de exportação para um arquivo docx. HTML é exibido OK, docx mostra os glifos não assinados, copiar do docx para o Bloco de Notas mostra os hifens no texto colado.

O que eu poderia fazer para resolver isso?

Responder1

Investiguei mais e encontrei uma explicação: o hífen U+2010 NÃO está contido na maioria das fontes, especialmente nas fontes fixas que geralmente são necessárias em programas como Vim e PuTTY.

Assim, a solução do meu problema do Confluence é: ao converter o conteúdo do wiki do Confluence para um formato de arquivo MS Word, escolha 'Arial Unicode MS Standard' como fonte padrão.

informação relacionada