Haga que la salida de pdflatex UTF-8 se pueda copiar y pegar cuando se utiliza la fuente Times

Haga que la salida de pdflatex UTF-8 se pueda copiar y pegar cuando se utiliza la fuente Times

me gustaría usarfuente Adobe Times Romano su equivalente (como URW Nimbus Roman y fuentes basadas en él), compilando en pdflatexPDF; la intención original era hacer que el PDF fuera más pequeño mediante el uso de fuentes integradas. El documento en cuestión está en polaco y utiliza codificación de entrada UTF-8. Me gustaría que el PDF fueracopiar y pegarconresultado en UTF-8, tanto para la familia romana como para la familia de máquinas de escribir (para listado de códigos).

Desafortunadamente ninguna de las soluciones en¿Cuáles son buenas formas de hacer que la salida de pdflatex se pueda copiar y pegar?funciona, al menos no como \usepackage{times}una forma de cambiar a una fuente tipo romana.

Tome un documento de ejemplo:

\documentclass{article}

\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}

\usepackage{times}
%\usepackage{lmodern}

\input glyphtounicode
\pdfgentounicode=1
%\usepackage{cmap}

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

El resultado no es un lío irreconocible de símbolos como enNo puedo copiar y pegar desde mi PDF. ¿Alguna idea de por qué?, pero algunos de los caracteres polacos se copian de una manera extraña, como si estuvieran precompuestos: con el carácter base y el acento (decoración) separados... y cualquiera de ellos puede estar fuera del flujo del texto.

Para el documento de ejemplo, el pdftotextresultado (y el resultado de copiar y pegar) es:

˙ ce ˛ z´
familia rm: zazół´ g˛ sia ja´ n
ttfamilia: za˙ół´ g˛sia ja´´
zce˛
zn

1

Si cambio de timesa lmodern(fuente latina moderna), y presumiblemente también cuando cambio a cm-superobtengo el resultado correcto:

familia rm: zażółć gęsią jaźń
ttfamilia: zażółć gęsią jaźń

1

Respuesta1

Puedes utilizar la fuente Times TeX Gyre Termes:

\documentclass{article}
\usepackage{tgtermes}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input glyphtounicode
\pdfgentounicode=1

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

ingrese la descripción de la imagen aquí

Copiar y pegar desde .pdfda este resultado:

rmfamily: zażółć gęsią jaźń
ttfamily: zażółć gęsią jaźń

Respuesta2

Añadiendo aLa respuesta de Sverredel uso de TeX Gyre Termes ( tgtermespaquete): no me funciona con \ttfamily/ \texttt{}es decir, fuentes de máquina de escribir. Obtengo lo siguiente de pdftotext(versión 0.12.4):

familia rm: zażółć gęsią jaźń
ttfamily: za»óª¢ g¦si¡ ja¹«

he navegadoEl catálogo de fuentes LaTeXy descubrí la siguiente solución: usefuente TXTTpara ttfamilia con\renewcommand*\ttdefault{txtt}:

\documentclass{article}

\usepackage{tgtermes}
\renewcommand*\ttdefault{txtt}

\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input glyphtounicode
\pdfgentounicode=1

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

información relacionada