Unicode con PdfLaTeX

Unicode con PdfLaTeX

Me gustaría que los símbolos de Alchemy funcionen en PdfLaTeX. No tengo acceso a XeTeX o LuaTex porque estoy usando Tex Writer en el iPad. Aquí hay dos ejemplos mínimos.

El primero funciona.

    \documentclass{article}
    \usepackage[T1]{fontenc}
    \usepackage{textcomp}
    \usepackage[utf8x]{inputenc}

    \begin{document}
    \unichar{"00E4}
    \unichar{"20AC}
    \end{document}

Éste no compila:

    \documentclass{article}
    \usepackage[T1]{fontenc}
    \usepackage{textcomp}
    \usepackage[utf8x]{inputenc}

    \begin{document}
    \unichar{"00E4}
    \unichar{"1F701}
    \end{document}

Aquí está el mensaje de error:

l.9 \unichar{"1F701}

? 
! Emergency stop.
 ...                                              

l.9 \unichar{"1F701}

Unicode character 128769 = U+1F701:
ALCHEMICAL SYMBOL FOR AIR
Character is not defined in uni-*.def files.
Enter I! to define the glyph.

Here is how much of TeX's memory you used:
 1717 strings out of 493024
 24829 string characters out of 6124273
 70825 words of memory out of 5000000
 5308 multiletter control sequences out of 15000+600000
 4403 words of font info for 15 fonts, out of 8000000 for 9000
 1141 hyphenation exceptions out of 8191
 23i,0n,17p,304b,478s stack positions out of 5000i,500n,10000p,200000b,80000s
!  ==> Fatal error occurred, no output PDF file produced!

Respuesta1

TeX es un tipógrafo: su trabajo es recoger glifos (formas) de una fuente y decidir dónde colocarlos en una página. Por lo tanto, la información sobre esas formas debe estar disponible para TeX.

Para interpretar su entrada, de forma predeterminada, TeX trata cada byte individualmente. Con \usepackage[utf8x]{inputenc}puede informarle a TeX que debe interpretar secuencias de bytes como caracteres Unicode, según lo especificado por la codificación UTF-8. Por ejemplo, cuando escribes en el archivo, entenderá lo que quiere decirel carácter Unicode U+20AC (SIGNO DEL EURO), ya que el archivo contendrá los bytes correspondientes a la codificación UTF-8 de ese carácter. Esto equivale a ingresar manualmente \unichar{"20AC}.

Pero comprender que se pretendía utilizar un carácter Unicode en particular no es suficiente: ¿y qué? TeX todavía necesita saber qué hacer con él.

Por ejemplo:

  • ä U+00E4 LETRA A MINÚSCULA LATINA CON DIERESISse define en texmf-dist/tex/latex/ucs/data/uni-0.defcomo \"a(que TeX sabe cómo hacer)
  • EURO U+20ACse define texmf-dist/tex/latex/ucs/data/uni-32.defcomo \ifx\euro\undefined\texteuro\else\euro\fique a su vez se hace de alguna manera a través de glifos disponibles en TeX

El personaje que quieresU+1F701 SÍMBOLO ALQUÍMICO DEL AIRE

información relacionada