Как получить код Unicode и название символа для некоторых символов в PDF-файле?

Как получить код Unicode и название символа для некоторых символов в PDF-файле?

У меня есть PDF-файл с некоторыми символами Unicode (см. рисунок).

введите описание изображения здесь

Я могу скопировать эти символы в буфер обмена и вставить, например, в MS Word, и я увижу символ как один квадрат с вопросительным знаком внутри, вероятно, потому, что соответствующий шрифт отсутствует в моей системе.

Я хочу получить код символа в UTF и его имя. Как мне их получить? Вот символы, которые меня интересуют, — может быть, их можно просто распознать напрямую? В любом случае, общее решение для PDF и Unicode было бы здорово.

решение1

В MS Word поместите курсор сразу после символа и введите Alt X (т. е. нажмите клавишу X, удерживая нажатой клавишу Alt). В любой достаточно современной версии Word это преобразует символ в его код Unicode. Чтобы узнать имя, вы можете посетитьhttp://www.unicode.orgили использовать программу Character Map в Windows, например. Или вы можете установитьBabelPad, великолепный редактор Unicode, который показывает номер Unicode и имя Unicode каждого символа, когда вы перемещаете курсор прямо перед ним.

Альтернативно, для большего веселья, вы можете использоватьhttp://shapecatcher.com/и нарисуйте символ. Для простых узоров это довольно эффективно. Он сразу распознал, что ваш первый символ — «Белый квадрат с верхним правым квадрантом» U+25F3, по моему довольно неуклюжему рисунку.

Связанный контент