%20%EC%9D%B4%EB%A6%84%EC%9D%80%20%EC%96%B4%EB%96%BB%EA%B2%8C%20%EA%B2%B0%EC%A0%95%EB%90%A9%EB%8B%88%EA%B9%8C%3F.png)
PDF 파일은 내부적으로 문자 모양을 사용합니다.이름. 예를 들어, PDF 파일에 나타나는 ≈
( U+2248
; TeX ) 의 이름은 .\approx
approxequal
TeX으로 생성된 PDF 파일에서 이러한 이름을 찾을 수 있습니다.
- TeX 코드를
\pdfcompresslevel=0
, - 결과 PDF 파일을 텍스트 파일로 검사하고
- 로 시작하는 줄을 찾습니다
/CharSet
.
(정보는 다음에서 가져옴울리케 피셔의 답변자세한 정보를 제공하는 다른 곳).
분명히 글리프 이름은 글꼴에 따라 다릅니다. 그럼 글꼴에 따라 결정되는 건가요? 모든 글꼴 형식이 이러한 이름을 사용합니까? 텍스트 이름을 사용하는 글꼴 형식은 무엇입니까? 모든 PDF 파일의 모든 글리프에 그러한 이름이 있습니까?
PDF 파일의 글리프 이름은 어떻게 결정됩니까?기존 것을 누가 결정했습니까?그것들은 무엇을 위한 것인가요?(PDF가 문자 모양을 숫자로 참조하지 않는 이유는 무엇입니까? 분명히 일부 독자는 문자 이름에 의존하고 있습니다(아래 하이퍼링크 감지에 대한 질문 링크 참조). 따라서 PDF 형식이나 일부 독자는일부이 이름에 대한 가정. 이름을 매개하는 이름을 사용하는 데에는 이유가 있을 것입니다. 아마도 이것은 PDF와 관련된 유니코드의 시대와 관련이 있을 것입니다.) (La)TeX 사용자가 이 주제에 대해 알아야 할 또 다른 것은 무엇입니까?
나에게는 PDF 글리프 이름 문제가 여기에 나타났습니다.
- 결과 PDF 파일에서 문자 모양의 유니코드 코드 포인트를 조작하려면 문자 모양 이름에 대한 지식이 필요합니다. 특히
glyphtounicode.tex
지도는글리프 이름에서다음과 같은 줄을 사용하여 유니코드 코드 포인트로 변환합니다\pdfglyphtounicode{approximatelyequal}{2245}
.glyphtounicode.tex에서 누락되거나 잘못된 매핑을 수정하는 방법 - 하나 이상의 PDF 리더는 HTTP URL 감지를 위한 경험적 방법으로 문자 이름을 사용합니다.\pdfgentounicode=1인 \input{glyphtounicode}는 링크와 같은 텍스트에서 원치 않는 하이퍼링크를 생성합니다.
비슷한 질문은\pdfglyphtounicode에 필요한 적절한 글리프 이름을 찾는 방법그러나 이 주제에서 다루어야 할 근거가 더 있습니다.
답변1
글리프 이름은 글꼴에 의해 결정된다는 것이 내 이해입니다. ("글리프"라는 용어 사용에 유의하십시오. 문자와 글리프는 서로 관련되어 있지만 서로 바꿔 사용할 수는 없습니다. 그러나 그것은 또 다른 이야기입니다.)
또한 글꼴에서 제공하는 이름은 글꼴 공급자에 따라 다르다는 것도 이해하고 있습니다. 어떤 방식으로든 "의미가 있을" 수도 있고(예: ASCII 문자, 유니코드, 설명적인 이름 등) 금속 활자 시대의 상황(오래된 단일 활자 기술 기호 목록에 표시됨)처럼 공급자의 내부 코드일 뿐입니다.
상황이 바뀔 수도 있지만 ... 숨을 참지 마십시오.
Ulrike가 말한 것에 덧붙여 유니코드는 숫자뿐만 아니라 이름도 사용합니다. 여기서 중요한(그러나 관련성이 없을 수도 있는 점) 한 가지는 이름과 번호가 모두 할당되면그들은 결코 변하지 않는다, 이름이 잘못되었거나 단지 무분별한 것으로 판명된 경우에도 마찬가지입니다.
두 번째 요점은 일부 글리프가~ 아니다반드시 하나의 고유한 유니코드로 이름이 지정되어야 합니다. 유니코드는 다음을 정의해야 합니다.의미, 모양이 아닙니다. "변형" 문자 모양(의미는 동일하지만 모양이 다름)은 두 가지 주요 방식으로 여러 유니코드로 표시될 수 있습니다.
(U+2264)와 U+20D2
\nvarleq
의 합성어인 "긴 수직 오버레이 결합" 과 같이 결합 구별 부호를 사용하여 ;\leq
수직 취소로 부정된 관계는 단일 유니코드로 표현되는 경우가 거의 없으며 유니코드 할당의 기본 원칙이 변경되지 않는 한 이는 표준으로 유지됩니다.정의된 "변형 선택기"(U+FE00)를 추가하여 지정합니다.인식됨(즉, 공식적으로는 유니코드로) 결합 발음 구별 부호를 추가하여 수정할 수 없는 변형입니다(예:
\lvertneqq
등호만 수직 부정하는 U+2268,U+FE00).
유니코드 기술 보고서 #25,수학에 대한 유니코드 지원, 섹션 2.17 및 2.18(26페이지 이하)에서 이러한 방법을 다룹니다.