Tornar a saída do pdflatex UTF-8 copiável e colável ao usar a fonte Times

Tornar a saída do pdflatex UTF-8 copiável e colável ao usar a fonte Times

eu gostaria de usarFonte Adobe Times Romanou seu equivalente (como URW Nimbus Roman e fontes baseadas nele), compilando para pdflatexPDF - a intenção original era diminuir o PDF usando fontes integradas. O documento em questão está em polonês e usa codificação de entrada UTF-8. Eu gostaria que o PDF fossecopiar e colarcomresultar em UTF-8, tanto para a família romana quanto para a família de máquinas de escrever (para listagem de códigos).

Infelizmente nenhuma das soluções emQuais são as boas maneiras de tornar a saída do pdflatex copiável e colável?funciona, pelo menos não como \usepackage{times}uma forma de mudar para uma fonte romana.

Veja um documento de exemplo:

\documentclass{article}

\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}

\usepackage{times}
%\usepackage{lmodern}

\input glyphtounicode
\pdfgentounicode=1
%\usepackage{cmap}

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

O resultado não é uma confusão irreconhecível de símbolos comoNão consigo copiar e colar do meu PDF. Alguma ideia do porquê?, mas alguns caracteres poloneses são copiados de uma forma estranha, como se fossem pré-compostos: com caractere base e acento (decoração) separados... e qualquer um deles pode estar fora do fluxo de texto.

Para o documento de exemplo, o pdftotextresultado (e o resultado de copiar e colar) é:

˙ ce ˛ z´
rmfamília: zazół´ g˛ sia ja´ n
ttfamília: za˙ół´ g˛sia ja´´
zce˛
zn

1

Se eu mudar de timespara lmodern(fonte Latin Modern) e, presumivelmente, também ao mudar para, cm-superobtenho o resultado correto:

rmfamily: zażółć gęsią jaźń
ttfamily: zażółć gęsią jaźń

1

Responder1

Você pode usar a fonte Times TeX Gyre Termes:

\documentclass{article}
\usepackage{tgtermes}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input glyphtounicode
\pdfgentounicode=1

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

insira a descrição da imagem aqui

Copie e cole do .pdfdá este resultado:

rmfamily: zażółć gęsią jaźń
ttfamily: zażółć gęsią jaźń

Responder2

Adicionando aA resposta de Sverrede usar TeX Gyre Termes ( tgtermespacote): não funciona para mim com \ttfamily/ \texttt{}ou seja, fontes de máquina de escrever. Recebo o seguinte da pdftotext(versão 0.12.4):

rmfamily: zażółć gęsią jaźń
ttfamília: za»óª¢ g¦si¡ ja¹«

eu navegueiO Catálogo de Fontes LaTeXe descobri a seguinte solução - useFonte TXTTpara família com\renewcommand*\ttdefault{txtt}:

\documentclass{article}

\usepackage{tgtermes}
\renewcommand*\ttdefault{txtt}

\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input glyphtounicode
\pdfgentounicode=1

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

informação relacionada