
Puede que esté mal informado, pero en términos generales:
- ¿Sigue siendo cierto que PDF, en principio, solo puede utilizar vectores de codificación de 8 bits?
- Si no, ¿cómo maneja LuaTeX/XeTeX conjuntos de glifos más grandes?
Respuesta1
Esta es simplemente una copia de una respuesta publicada en Stack Overflow.plinto escribe lo siguiente:
En la referencia en PDF del capítulo 3, esto es lo que dicen sobre Unicode:
Las cadenas de texto están codificadas en codificación PDFDocEncoding o codificación de caracteres Unicode. PDFDocEncoding es un superconjunto de la codificación ISO Latin 1 y está documentado en el Apéndice D. Unicode se describe en el Estándar Unicode del Consorcio Unicode (consulte la Bibliografía). Para cadenas de texto codificadas en Unicode, los primeros dos bytes deben ser 254 seguidos de 255. Estos dos bytes representan el marcador de orden de bytes Unicode, U+FEFF, lo que indica que la cadena está codificada en el esquema de codificación UTF-16BE (big-endian). especificado en el estándar Unicode. (Este mecanismo impide comenzar una cadena usando PDFDocEncoding con los dos caracteres thorn ydieresis, lo que es poco probable que sea un comienzo significativo de una palabra o frase).
Por lo tanto, la respuesta a la pregunta 1 es que ahora no es cierto, incluso si lo fue en algún momento. De ello se deduce que la pregunta 2 no viene al caso ('discutible' para los lectores de América del Norte).