
Я хотел бы использоватьШрифт Adobe Times Romanили его эквивалент (например, URW Nimbus Roman и шрифты на его основе), компилируя в pdflatex
PDF — изначально предполагалось уменьшить размер PDF за счет использования встроенных шрифтов. Документ, о котором идет речь, на польском языке и использует кодировку ввода UTF-8. Я хотел бы, чтобы PDF былкопировать-и-вставлятьсрезультат в UTF-8, как для римской семьи, так и для семьи пишущих машинок (для перечисления кодов).
К сожалению, ни одно из решений вКаковы хорошие способы сделать вывод pdflatex пригодным для копирования и вставки?работает, по крайней мере, не как \usepackage{times}
способ переключиться на шрифт, похожий на латиницу.
Возьмем пример документа:
\documentclass{article}
\usepackage[utf8]{inputenc}
\usepackage[T1]{fontenc}
\usepackage{times}
%\usepackage{lmodern}
\input glyphtounicode
\pdfgentounicode=1
%\usepackage{cmap}
\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}
Результатом не является неузнаваемая мешанина символов, как это было вНе могу скопировать-вставить из моего PDF. Есть идеи почему?, но некоторые польские символы скопированы странным образом, как будто заранее составлены: с раздельными базовым символом и ударением (украшением)... и любой из них может быть вырван из текста.
Для примера документа pdftotext
результат (и результат копирования и вставки) следующий:
˙ ce ˛ z´ rmfamily: зазол´ г˛ сиа я´ н ttfamily: за˙óл´ г˛ся я´´ зце ˛ зн 1
Если я переключаюсь с times
на lmodern
(шрифт Latin Modern), а также, предположительно, при переключении на cm-super
я получаю правильный результат:
rmfamily: зажулч гессиа язь ttfamily: зажолч гесія язь 1
решение1
Вы можете использовать шрифт Times TeX Gyre Termes
:
\documentclass{article}
\usepackage{tgtermes}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\input glyphtounicode
\pdfgentounicode=1
\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}
Скопируйте и вставьте, и .pdf
результат будет следующим:
rmfamily: zażółć gęsią jaźń
ttfamily: zażółć gęsią jaźń
решение2
Добавление кОтвет Сверреиспользования TeX Gyre Termes ( tgtermes
пакет): у меня не работает с \ttfamily
/ \texttt{}
ie шрифтами пишущей машинки. Я получаю следующее от pdftotext
(версия 0.12.4):
rmfamily: зажулч гессиа язь ttfamily: za»óª¢ g¦si¡ ja¹«
Я просмотрелКаталог шрифтов LaTeXи нашел следующее решение -- использоватьШрифт TXTTдля семьи с\renewcommand*\ttdefault{txtt}
:
\documentclass{article}
\usepackage{tgtermes}
\renewcommand*\ttdefault{txtt}
\usepackage[T1]{fontenc}
\usepackage[utf8]{inputenc}
\input glyphtounicode
\pdfgentounicode=1
\begin{document}
\noindent
\rmfamily
rmfamily: zażółć gęsią jaźń \\
\ttfamily
ttfamily: zażółć gęsią jaźń \\
\end{document}