Benutzer-UTF-8-Zeichenfolge in ConTeXt

Question

Wenn Sie nur die folgenden Zeichen benötigen \ua000, können Sie vermutlich verwenden

\def\u#1#2#3#4{\uchar"#1#2#3#4 }

Wenn Sie höhere Zeichen mit einem nachfolgenden Buchstaben verwenden müssen, \ukönnen Sie zusätzlich ua als Nicht-Buchstabenzeichen verwenden.

\catcode`\u=12

aber am besten machen Sie das in einer lokalen Gruppe, sonst geht etwas kaputt.

(Hierbei werden nur Luatex-Grundelemente verwendet, daher sollte es im Kontext funktionieren.)

Beachten Sie, dass Zeichen zwischen U+FFFF und U+10FFFF in JSON durch zwei Sequenzen dargestellt werden, \udie die UTF-16-Kodierung des Unicode-Werts bezeichnen. Eine vollständige Lösung müsste also das erste Zeichen eines UTF-16-Ersatzpaars erkennen und mit dem folgenden \uCode kombinieren.

Answer 1