Unicode mit PdfLaTeX

Unicode mit PdfLaTeX

Ich möchte Alchemy-Symbole in PdfLaTeX zum Laufen bringen. Ich habe keinen Zugriff auf XeTeX oder LuaTex, da ich Tex Writer auf dem iPad verwende. Hier sind zwei Minimalbeispiele.

Das erste funktioniert.

    \documentclass{article}
    \usepackage[T1]{fontenc}
    \usepackage{textcomp}
    \usepackage[utf8x]{inputenc}

    \begin{document}
    \unichar{"00E4}
    \unichar{"20AC}
    \end{document}

Das hier wird nicht kompiliert:

    \documentclass{article}
    \usepackage[T1]{fontenc}
    \usepackage{textcomp}
    \usepackage[utf8x]{inputenc}

    \begin{document}
    \unichar{"00E4}
    \unichar{"1F701}
    \end{document}

Hier ist die Fehlermeldung:

l.9 \unichar{"1F701}

? 
! Emergency stop.
 ...                                              

l.9 \unichar{"1F701}

Unicode character 128769 = U+1F701:
ALCHEMICAL SYMBOL FOR AIR
Character is not defined in uni-*.def files.
Enter I! to define the glyph.

Here is how much of TeX's memory you used:
 1717 strings out of 493024
 24829 string characters out of 6124273
 70825 words of memory out of 5000000
 5308 multiletter control sequences out of 15000+600000
 4403 words of font info for 15 fonts, out of 8000000 for 9000
 1141 hyphenation exceptions out of 8191
 23i,0n,17p,304b,478s stack positions out of 5000i,500n,10000p,200000b,80000s
!  ==> Fatal error occurred, no output PDF file produced!

Antwort1

TeX ist ein Schriftsetzer: Seine Aufgabe besteht darin, Glyphen (Formen) aus einer Schriftart auszuwählen und zu entscheiden, wo sie auf einer Seite platziert werden. Daher müssen TeX Informationen über diese Formen zur Verfügung stehen.

Bei der Interpretation Ihrer Eingabe behandelt TeX standardmäßig jedes Byte einzeln. Mit \usepackage[utf8x]{inputenc}können Sie TeX mitteilen, dass es Bytefolgen als Unicode-Zeichen interpretieren soll, wie es in der UTF-8-Kodierung angegeben ist. Wenn Sie beispielsweise in die Datei tippen, versteht TeX, dass Sie meinendas Unicode-Zeichen U+20AC (EURO-ZEICHEN), da die Datei die Bytes enthält, die der UTF-8-Kodierung dieses Zeichens entsprechen. Dies entspricht der manuellen Eingabe von \unichar{"20AC}.

Aber zu wissen, dass Sie ein bestimmtes Unicode-Zeichen beabsichtigt haben, reicht nicht aus: Na und? TeX muss immer noch wissen, was damit zu tun ist.

Zum Beispiel:

Der Charakter, den Sie wollen,U+1F701 ALCHEMISCHES SYMBOL FÜR LUFT

verwandte Informationen