Как определяются названия глифов (символов) в PDF-файлах?

Как определяются названия глифов (символов) в PDF-файлах?

PDF-файлы используют внутреннее использование глифовимена. Например, имя ( U+2248; TeX \approx), появляющееся в PDF-файле, может быть approxequal.

Такие имена можно найти в PDF-файле, созданном с помощью TeX,

  1. компиляция кода TeX с помощью \pdfcompresslevel=0,
  2. проверка полученного PDF-файла как текстового файла и
  3. ищем строки, начинающиеся с /CharSet.

(информация взята изОтвет Ульрики Фишерв другом месте, где содержится дополнительная информация).

Видимо, названия глифов зависят от шрифта. То есть они определяются шрифтами? Все ли форматы шрифтов используют такие названия? Какие форматы шрифтов используют текстовые названия? Все ли глифы во всех PDF-файлах имеют такие названия?

Как определяются названия глифов в PDF-файлах?Кто определил существующие?Для чего они?(Почему PDF не ссылается на глифы по номерам? Очевидно, некоторые читатели полагаются на названия глифов (см. ссылку на вопрос об обнаружении гиперссылок ниже), поэтому формат PDF или некоторые читатели делаютнекоторый(Предположения об этих именах. Должна быть причина, по которой используется посредник имен. Возможно, это связано с возрастом Unicode по отношению к PDF.) Что еще нужно знать по этой теме пользователю (La)TeX?

Для меня проблема с названиями глифов PDF возникла здесь:

Аналогичный вопрос:Как найти правильное имя глифа, требуемое \pdfglyphtounicode, но в этой теме есть еще много вопросов, которые необходимо рассмотреть.

решение1

Насколько я понимаю, названия глифов определяются шрифтом. (обратите внимание на использование термина «глиф»; символы и глифы связаны, но не взаимозаменяемы. но это уже другая история.)

Я также понимаю, что имена, предоставляемые шрифтом, зависят от поставщика шрифта — они могут быть «имеющими значение» в некотором роде (например, буква ASCII, Unicode, описательное имя, ...) или они могут быть просто внутренним кодом поставщика, как это было во времена металлических шрифтов (как показано в старых списках технических символов монотипов).

Все может измениться, но... не ждите чуда.

В дополнение к сказанному Ульрике, Unicode также использует имена, а также числа. Важным (но, возможно, не относящимся к делу) моментом здесь является то, что после того, как назначены и имя, и число,они никогда не меняются, даже если название окажется неправильным или просто нецелесообразным.

второй момент заключается в том, что некоторые глифынетобязательно названный одним уникальным юникодом. юникод должен определятьзначение, а не форма. «Вариантные» глифы (с одинаковым значением, но разной формой) могут быть представлены несколькими юникодами двумя основными способами:

  • с помощью комбинирующего диакритического знака, как \nvarleqв соединении \leq(U+2264) и U+20D2, «объединяющего длинное вертикальное наложение»; практически никакие отношения, отрицаемые вертикальным сокращением, не представлены отдельными юникодами, и если основные принципы назначения юникодов не изменятся, это останется нормой.

  • путем добавления определенного «селектора вариации» (U+FE00) для обозначенияпризнанный(т. е. официально по Юникоду) варианты, которые невозможно изменить добавлением объединяющего диакритического знака, например \lvertneqq(меньше, но не равно с вертикальным отрицанием только знака равенства, U+2268,U+FE00).

технический отчет unicode №25,поддержка юникода для математики, рассматривает эти методы в разделах 2.17 и 2.18 (стр. 26 и далее).

Связанный контент