Сделать вывод pdflatex UTF-8 копируемым и вставляемым при использовании шрифта Times

Сделать вывод pdflatex UTF-8 копируемым и вставляемым при использовании шрифта Times

Я хотел бы использоватьШрифт Adobe Times Romanили его эквивалент (например, URW Nimbus Roman и шрифты на его основе), компилируя в pdflatexPDF — изначально предполагалось уменьшить размер PDF за счет использования встроенных шрифтов. Документ, о котором идет речь, на польском языке и использует кодировку ввода UTF-8. Я хотел бы, чтобы PDF былкопировать-и-вставлятьсрезультат в UTF-8, как для римской семьи, так и для семьи пишущих машинок (для перечисления кодов).

К сожалению, ни одно из решений вКаковы хорошие способы сделать вывод pdflatex пригодным для копирования и вставки?работает, по крайней мере, не как \usepackage{times}способ переключиться на шрифт, похожий на латиницу.

Возьмем пример документа:

\documentclass{article}

\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}

\usepackage{times}
%\usepackage{lmodern}

\input glyphtounicode
\pdfgentounicode=1
%\usepackage{cmap}

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

Результатом не является неузнаваемая мешанина символов, как это было вНе могу скопировать-вставить из моего PDF. Есть идеи почему?, но некоторые польские символы скопированы странным образом, как будто заранее составлены: с раздельными базовым символом и ударением (украшением)... и любой из них может быть вырван из текста.

Для примера документа pdftotextрезультат (и результат копирования и вставки) следующий:

˙ ce ˛ z´
rmfamily: зазол´ г˛ сиа я´ н
ttfamily: за˙óл´ г˛ся я´´
зце ˛
зн

1

Если я переключаюсь с timesна lmodern(шрифт Latin Modern), а также, предположительно, при переключении на cm-superя получаю правильный результат:

rmfamily: зажулч гессиа язь
ttfamily: зажолч гесія язь

1

решение1

Вы можете использовать шрифт Times TeX Gyre Termes:

\documentclass{article}
\usepackage{tgtermes}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input glyphtounicode
\pdfgentounicode=1

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

введите описание изображения здесь

Скопируйте и вставьте, и .pdfрезультат будет следующим:

rmfamily: zażółć gęsią jaźń
ttfamily: zażółć gęsią jaźń

решение2

Добавление кОтвет Сверреиспользования TeX Gyre Termes ( tgtermesпакет): у меня не работает с \ttfamily/ \texttt{}ie шрифтами пишущей машинки. Я получаю следующее от pdftotext(версия 0.12.4):

rmfamily: зажулч гессиа язь
ttfamily: za»óª¢ g¦si¡ ja¹«

Я просмотрелКаталог шрифтов LaTeXи нашел следующее решение -- использоватьШрифт TXTTдля семьи с\renewcommand*\ttdefault{txtt}:

\documentclass{article}

\usepackage{tgtermes}
\renewcommand*\ttdefault{txtt}

\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}

\input glyphtounicode
\pdfgentounicode=1

\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}

Связанный контент