Quando um hífen codificado em UTF-8 (U+2010) é copiado de um navegador (tentei Firefox e IE) e depois colado em programas como Putty e Vim (as variantes do Windows), todos os hífens são mostrados como 'glifos desconhecidos' . Colar no Bloco de Notas funciona perfeitamente. Copiar/colar no Debian/wheezy do mesmo texto HTML (copiar do iceweasel, colar no vim) também funciona conforme o esperado.
Mas o caractere utf-8 não está prejudicado. Salvando no disco resp. copiar e colar o texto danificado funciona conforme planejado.
O verdadeiro problema que tenho que resolver é o Confluence e sua função de exportação para um arquivo docx. HTML é exibido OK, docx mostra os glifos não assinados, copiar do docx para o Bloco de Notas mostra os hifens no texto colado.
O que eu poderia fazer para resolver isso?
Responder1
Investiguei mais e encontrei uma explicação: o hífen U+2010 NÃO está contido na maioria das fontes, especialmente nas fontes fixas que geralmente são necessárias em programas como Vim e PuTTY.
Assim, a solução do meu problema do Confluence é: ao converter o conteúdo do wiki do Confluence para um formato de arquivo MS Word, escolha 'Arial Unicode MS Standard' como fonte padrão.