Bindestrich wird beim Einfügen in Programme wie Putty in „unbekanntes Zeichen“ umgewandelt, Notepad ist OK

Bindestrich wird beim Einfügen in Programme wie Putty in „unbekanntes Zeichen“ umgewandelt, Notepad ist OK

Wenn ein UTF-8-kodierter Bindestrich (U+2010) aus einem Browser kopiert wird (ich habe es mit Firefox und IE versucht) und dann in Programme wie Putty und Vim (die Windows-Varianten) eingefügt wird, werden alle Bindestriche als „unbekannte Glyphen“ angezeigt. Das Einfügen in Notepad funktioniert einwandfrei. Das Kopieren/Einfügen desselben HTML-Textes in Debian/Wheezy (Kopieren aus Iceweasel, Einfügen in Vim) funktioniert ebenfalls wie erwartet.

Die UTF-8-Zeichen werden jedoch nicht beschädigt. Das Speichern auf der Festplatte bzw. das Kopieren und Einfügen des beschädigten Textes funktioniert wie vorgesehen.

Das eigentliche Problem, das ich lösen muss, betrifft Confluence und seine Exportfunktion in eine docx-Datei. HTML wird ordnungsgemäß angezeigt, docx zeigt die nicht signierten Glyphen, beim Kopieren von docx nach Notepad werden die Bindestriche im eingefügten Text angezeigt.

Was kann ich tun, um das Problem zu lösen?

Antwort1

Ich habe weiter nachgeforscht und eine Erklärung gefunden: Der Bindestrich U+2010 ist in den meisten Schriftarten NICHT enthalten, insbesondere nicht in den festen Schriftarten, die normalerweise in Programmen wie Vim und PuTTY benötigt werden.

Die Lösung meines Confluence-Problems lautet also: Wählen Sie beim Konvertieren des Inhalts des Confluence-Wikis in ein MS Word-Dateiformat „Arial Unicode MS Standard“ als Standardschriftart.

verwandte Informationen