Putty、メモ帳などのプログラムに貼り付けるとハイフンが「不明な文字」に変換されますが、問題ありません。

Putty、メモ帳などのプログラムに貼り付けるとハイフンが「不明な文字」に変換されますが、問題ありません。

UTF-8 でエンコードされたハイフン (U+2010) をブラウザー (Firefox と IE を試しました) からコピーし、Putty や Vim (Windows 版) などのプログラムに貼り付けると、すべてのハイフンが「不明なグリフ」として表示されます。メモ帳への貼り付けは問題なく機能します。Debian/wheezy でまったく同じ HTML テキストをコピー/貼り付け (iceweasel からコピーし、vim に貼り付け) しても、期待どおりに機能します。

しかし、utf-8 文字は無効ではありません。無効になったテキストをディスクに保存したり、コピーして貼り付けたりすることは、設計どおりに機能します。

私が解決しなければならない本当の問題は、Confluence と docx ファイルへのエクスポート機能にあります。HTML は正常に表示されますが、docx には署名されていないグリフが表示され、docx からメモ帳にコピーすると、貼り付けられたテキストにハイフンが表示されます。

これを解決するにはどうすればいいでしょうか?

答え1

さらに調べてみると、説明が見つかりました。ハイフン U+2010 はほとんどのフォントには含まれておらず、特に Vim や PuTTY などのプログラムで通常必要とされる固定フォントには含まれていません。

したがって、私の Confluence の問題の解決策は、Confluence wiki のコンテンツを MS Word ファイル形式に変換するときに、デフォルトのフォントとして「Arial Unicode MS Standard」を選択することです。

関連情報