T1 fontenc - 文字不可搜尋

T1 fontenc - 文字不可搜尋

每當我使用 T1 fontenc 時,都無法搜尋輸出 PDF 的文字。你可以在下面找到一個MWE,pdflatex輸出這裡和日誌文件這裡

\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\begin{document}
\section{Hola amigo}
Todo bien
\end{document}

顯然,如果我從序言中刪除fontenc包,則可以毫無問題地搜尋文字。

我不知道這是否可能與我的 texlive 發行版有關(我使用的是 ArchLinux)。

答案1

當您按原樣使用電腦現代字體時(我cm-super在日誌中看到,很好),該軟體包cmap會有所幫助。

另一方面,最好使用拉丁現代字體,並有glyphtounicode複製/貼上的部分:

\usepackage{lmodern}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input{glyphtounicode}
\pdfgentounicode=1

T1然而,這裡列出的複製/貼上有一些限制,例如ĐPDF 中有克羅埃西亞語,複製它會給您冰島語Ð(Eth) - 不是相同的字元。

關於此事的更多(簡單)細節在這裡:https://en.wikipedia.org/wiki/Cork_encoding#Supported_languages

完整的編碼定義,包含許多細節和解釋:http://www.tug.org/fontname/ec.enc

相關內容