Machen Sie die PDFLatex-Ausgabe bei Verwendung der Schriftart Times in UTF-8 kopier- und einfügbar.

Machen Sie die PDFLatex-Ausgabe bei Verwendung der Schriftart Times in UTF-8 kopier- und einfügbar.

Ich möchte verwendenSchriftart Adobe Times Romanoder sein Äquivalent (wie URW Nimbus Roman und darauf basierende Schriftarten), kompiliert mit pdflatexin PDF - die ursprüngliche Absicht war, PDF durch die Verwendung integrierter Schriftarten kleiner zu machen. Das betreffende Dokument ist in polnischer Sprache und verwendet die Eingabekodierung UTF-8. Ich möchte, dass das PDFkopier- und einfügbarmitErgebnis in UTF-8, sowohl für die römische Familie als auch für die Schreibmaschinenfamilie (für die Codeauflistung).

Leider keine der Lösungen inWelche Möglichkeiten gibt es, die PDFLatex-Ausgabe kopier- und einfügbar zu machen?funktioniert, zumindest nicht mit \usepackage{times}der Möglichkeit, zu einer antiqua-ähnlichen Schriftart zu wechseln.

Nehmen Sie ein Beispieldokument:

\documentclass{article}

\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}

\usepackage{times}
%\usepackage{lmodern}

\input glyphtounicode
\pdfgentounicode=1
%\usepackage{cmap}

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

Das Ergebnis ist kein unkenntliches Durcheinander von Symbolen wie inIch kann aus meiner PDF-Datei nicht kopieren und einfügen. Irgendeine Idee, warum?, aber einige polnische Zeichen werden auf seltsame Weise kopiert, als wären sie vorkomponiert: mit getrenntem Grundzeichen und Akzent (Verzierung) … und jedes von beiden kann außerhalb des Textflusses liegen.

Für das Beispieldokument pdftotextlautet das Ergebnis (und das Copy-and-Paste-Ergebnis):

˙ ce ˛ z´
rmfamily: zazół´ g˛ sia ja´ n
ttfamily: za˙ół´ g˛sia ja´´
zce ˛
zn

1

timesWenn ich von auf (Schriftart Latin Modern) umschalte lmodern, und vermutlich auch beim Umschalten auf cm-supererhalte ich das richtige Ergebnis:

rmfamily: altes Ehepaar
ttfamily: Familienvater

1

Antwort1

Sie können die Schriftart Times verwenden TeX Gyre Termes:

\documentclass{article}
\usepackage{tgtermes}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input glyphtounicode
\pdfgentounicode=1

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

Bildbeschreibung hier eingeben

Kopieren und Einfügen .pdfergibt dieses Ergebnis:

rmfamily: zażółć gęsią jaźń
ttfamily: zażółć gęsią jaźń

Antwort2

Hinzufügen zuSverres Antwortder Verwendung von TeX Gyre Termes ( tgtermesPaket): es funktioniert bei mir nicht mit \ttfamily/ \texttt{}ie Schreibmaschinenschriften. Ich erhalte das Folgende ab pdftotext(Version 0.12.4):

rmfamily: altes Ehepaar
ttfamily: za»óª¢ g¦si¡ ja¹«

Ich habe gestöbertDer LaTeX-Schriftartenkatalogund habe die folgende Lösung gefunden -- benutzeTXTT-Schriftartfür ttfamily mit\renewcommand*\ttdefault{txtt}:

\documentclass{article}

\usepackage{tgtermes}
\renewcommand*\ttdefault{txtt}

\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input glyphtounicode
\pdfgentounicode=1

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

verwandte Informationen