pdftex에서 무시되는 인용문

pdftex에서 무시되는 인용문

나는 Donald Knuth의 TeXBook, 연습 2.1을 읽고 있습니다. 다음과 같은 입력이 있습니다.

Alice said, ‘‘I always use an en-dash instead of a hyphen when specifying page numbers like ‘480--491’ in a bibliog
raphy.’’
\bye

를 사용하여 컴파일하면 pdftex sample.tex다음과 같은 출력이 제공됩니다. en-dash는 작동하지만 따옴표는 어디로 갔습니까?

여기에 이미지 설명을 입력하세요

답변1

둥근 따옴표 대신 ‘‘사용 하십시오.

``I always use an en-dash instead of a hyphen when specifying page numbers
like `480--491' in a.''
\bye

여기에 이미지 설명을 입력하세요

답변2

TeXbook의 소스 코드를 보면,CTAN에서 사용 가능, 알다시피

\exercise Explain how to type the following sentence to \TeX: Alice said,
``I always use an en-dash instead of a hyphen when specifying page numbers
like `480--491' in a ^{bibliography}.''
\answer |Alice said, ``I always use an en-dash instead of a hyphen when|\break
|specifying page numbers like `480--491' in a bibliography.''| \
(The wrong answer to this question ends with |'480-49l' in a bibliography."|)

pdftex코드 로 컴파일하면

Alice said, ``I always use an en-dash instead of a hyphen when specifying
page numbers like `480--491' in a bibliography.''
\bye

그런 다음 PDF에서 복사하여 붙여넣으면

Alice는 “저는 참고문헌에서 '480-491'과 같은 페이지 번호를 지정할 때 항상 하이픈 대신 en-dash를 사용합니다.”라고 말했습니다.

PDF 리더는 충분히 똑똑하기 때문입니다.

그러나 TeXbook의 코드 조각에 있는 문자는 실제로 다음을 의미하므로 ‘‘and를 사용해서는 안 됩니다 .’’

`` ''

TeX은 7비트 ASCII 문자만 사용하는 반면 및는 어떤 인코딩에서도 해당 범위에 속하지 않는다는 점을 기억하세요.

답변3

TeX과TeXbook컴퓨터와 소프트웨어는 현재와 두 가지 면에서 달랐습니다.

  1. 각 컴퓨터/OS는 현재 사용 가능한 전체 유니코드 범위보다 더 적은 문자(보통 최대 256개)를 가졌습니다. 특히 입력한 둥근 따옴표 ' (U+‎2018 LEFT SINGLE QUOTATION MARK) 및 ' (‎U+2019 RIGHT SINGLE QUOTATION MARK) 는 문자 세트에 없었습니다.

  2. 대신 Knuth에게 친숙한 시스템을 포함한 일부 시스템은 시각적으로 대칭으로 나타나고 동일한 목적을 수행하는 문자에 대해 현재 ` (U+0060 GRAVE ACCENT) 및 '(U+0027 APOSTROPHE)가 차지하는 위치를 사용했습니다. 이 역사는 페이지에 잘 설명되어 있습니다.ASCII 및 유니코드 따옴표Markus Kuhn("문제"까지 아래로 스크롤) 및견적 패키지.

이에 따라 결과는 다음과 같습니다.

  1. ASCII가 아닌 문자를 TeX에 입력하면 문자를 오해하게 되고 (심각한 설계 결함 IMO) 큰 소리로 불평조차 하지 않습니다. 파일을 살펴봐야 합니다 .log. 실수로 이런 일이 발생하지 않도록 하려면

    • 모든 파일의 맨 위에 배치하고 \tracinglostchars=2(그리고 eTeX 파생 엔진을 사용하십시오. pdftex사용 중인 엔진은 괜찮습니다) 및/또는

    • .logTeX가 "(추가 정보는 기록 파일 참조)"라고 말할 때마다 항상 파일을 살펴보십시오.

  2. 곱슬따옴표처럼 보이는 것을 보면TeXbook, 유니코드와 최신 글꼴에 따르면 이는 명백히 잘못된 것이지만 ` 및 '로 이해하고 입력해야 합니다. 해당 글꼴의 특이한 점으로 취급하십시오.

보너스: 유니코드 문자만 사용하고 ASCII 문자 합자를 사용하여 큰따옴표 및 대시(대시)와 같은 작업을 수행하는 기존 방법을 사용하지 않으려면 XeTeX 또는 LuaTeX와 같은 유니코드 엔진을 사용할 수 있습니다. 여기 예제에서 작동하는 파일은 다음과 같습니다. xetex또는 로 컴파일 luatex:

\tracinglostchars=2
% \input luaotfload.sty % Uncomment this line if using LuaTeX
\font\tenrm="[lmroman10-regular]" at 10pt
\rm
Alice said, “I always use an en-dash instead of a hyphen when specifying 
page numbers like ‘480–491’ in a bibliography.”
\bye

(물론 하이픈 대신 엔 대시를 사용하는 것을 기억해야 하며, 입력 파일을 편집할 때 차이점을 쉽게 알 수 있는 글꼴을 사용해야 합니다.)

관련 정보