T1 fontenc - текст недоступен для поиска

T1 fontenc - текст недоступен для поиска

Всякий раз, когда я использую шрифт T1, текст выходного PDF-файла не может быть найден. Вы можете найти MWE ниже, pdflatexвыходной файлздесьи файл журналаздесь.

\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\begin{document}
\section{Hola amigo}
Todo bien
\end{document}

Очевидно, если я удалю fontencпакет из преамбулы, текст будет доступен для поиска без проблем.

Я не знаю, может ли это быть связано с моим дистрибутивом texlive (у меня ArchLinux).

решение1

При использовании шрифтов Computer Modern, как вы (я вижу cm-superв ваших журналах, это хорошо), пакет cmapбыл бы полезен.

С другой стороны, лучше использовать современные латинские шрифты и иметь glyphtounicodeчасть для копирования/вставки:

\usepackage{lmodern}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input{glyphtounicode}
\pdfgentounicode=1

Однако существуют некоторые ограничения, связанные с T1копированием/вставкой, перечисленные здесь. Например, если Đв PDF-файле есть хорватский текст, то при копировании вы получите исландский Ð(Eth), а это не тот же символ.

Более (краткая) информация по этому вопросу здесь:https://en.wikipedia.org/wiki/Cork_encoding#Поддерживаемые_языки

Полное определение кодировки со множеством деталей и пояснений:http://www.tug.org/fontname/ec.enc

Связанный контент