
Wenn ich die T1-Schriftart verwende, kann der Text des Ausgabe-PDFs nicht durchsucht werden. Unten finden Sie ein MWE, die pdflatex
AusgabeHierund die LogdateiHier.
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\begin{document}
\section{Hola amigo}
Todo bien
\end{document}
Wenn ich das Paket aus der Präambel lösche, fontenc
ist der Text offensichtlich problemlos durchsuchbar.
Ich weiß nicht, ob es ein Problem mit meiner Texlive-Distribution sein könnte (ich verwende ArchLinux).
Antwort1
Wenn Sie wie Sie moderne Computerschriftarten verwenden (wie ich cm-super
Ihren Protokollen entnehmen kann, ist das gut), cmap
würde das Paket helfen.
Andererseits ist es besser, stattdessen moderne lateinische Schriftarten zu verwenden und glyphtounicode
einen Teil zum Kopieren/Einfügen vorzusehen:
\usepackage{lmodern}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\input{glyphtounicode}
\pdfgentounicode=1
T1
Beim hier aufgeführten Kopieren/Einfügen gibt es jedoch einige Einschränkungen. Wenn Đ
die PDF-Datei beispielsweise Kroatisch ist, wird beim Kopieren das Isländische Ð
(Eth) ausgegeben und nicht derselbe Buchstabe.
Weitere (leichte) Details zu diesem Thema hier:https://en.wikipedia.org/wiki/Cork_encoding#Unterstützte_Sprachen
Vollständige Kodierungsdefinition mit vielen Details und Erklärungen:http://www.tug.org/fontname/ec.enc