Вывод любого текста в кодировке Unicode (не только определенных языков)

Вывод любого текста в кодировке Unicode (не только определенных языков)

Мое программное обеспечение использует pdflatexдля генерации файлов PDF, которые включают текст, введенный пользователями. Этот текст может быть на любом языке, поэтому мне нужно что-то вроде следующего, чтобы "просто работать" с любым произвольным содержимым Unicode:

\usepackage[T1,T2A]{fontenc}
\usepackage[utf8]{inputenc}

\begin{document}
Öüä Эюя Tiếng Việt 日本語
\end{document}

Я добавил кодировки T1и T2A, так что европейские/кирилловские языки теперь должны быть в порядке. Я могу добавить больше, но согласноруководство CTAN, кодировки для языков вроде китайского являются "экспериментальными". Надежный способ вывода многих языков, похоже, заключается в установке и использовании дополнительных пакетов, специфичных для них, например cjk. Мне действительно нужно проходить по всем языкам мира (иногда по одному) и устанавливать все, что там есть?! Прямо сейчас я испытываю искушение просто сгенерировать изображение с текстом и \includegraphicsим, что можетна самом деле быть менее смешным.

Может ли кто-нибудь предложить лучший способ?Я предполагал, что система набора текста, используемая академическими кругами по всему миру в 2016 году, будет иметь простую, разумную поддержку Unicode. Сейчас ее нет.

решение1

По сути, вы просите огромное предприятие без каких-либо реальных преимуществ. Даже идея использования изображений потребовала бы огромного объема работы.

Если вы используете XeLaTeX/LuaLaTeX со шрифтом, имеющим широкое покрытие Unicode, вы довольно быстро окажетесь дома.

\documentclass{article}
\usepackage{fontspec}

\setmainfont{Code2000}

\begin{document}

Öüä Эюя Tiếng Việt 日本語

\end{document}

введите описание изображения здесь

Связанный контент