T1 fontenc - texto não pesquisável

T1 fontenc - texto não pesquisável

Sempre que utilizo o fontenc T1, o texto do PDF de saída não pode ser pesquisado. Você pode encontrar um MWE abaixo, a pdflatexsaídaaquie o arquivo de logaqui.

\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\begin{document}
\section{Hola amigo}
Todo bien
\end{document}

Obviamente, se eu excluir o fontencpacote do preâmbulo, o texto poderá ser pesquisado sem problemas.

Não sei se pode ser um problema relacionado à minha distribuição texlive (estou no ArchLinux).

Responder1

Ao usar fontes Computer Modern como você está (vejo cm-superem seus registros, ótimo), o pacote cmapajudaria.

Por outro lado, é melhor usar fontes Latin Modern e ter glyphtounicodeparte para copiar/colar:

\usepackage{lmodern}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input{glyphtounicode}
\pdfgentounicode=1

No entanto, existem algumas limitações para T1copiar/colar listadas aqui, por exemplo, ter croata Đem PDF e copiá-lo daria a você o islandês Ð(Eth) - não o mesmo caractere.

Mais detalhes (leves) sobre este assunto aqui:https://en.wikipedia.org/wiki/Cork_encoding#Supported_Languages

Definição completa de codificação com muitos detalhes e explicações:http://www.tug.org/fontname/ec.enc

informação relacionada