
Tengo un problema si copio palabras de un PDF (generado con XeLaTeX) donde el texto copiado incluye caracteres griegos aleatorios.
\documentclass[12pt,a4paper,english]{report}
% setup encoding
\usepackage[utf8]{inputenc}
%set language
\usepackage[british,english]{babel}
\usepackage[T1]{fontenc}
\usepackage{lmodern,cmap}
%setup font
\usepackage{fontspec}
\setmainfont{Calibri}
\begin{document}
{\large A dissertation submitted in partial fulfilment of\\
the requirements for the degree of\\}
\end{document}
(He omitido el texto por simplicidad).
Al generar un PDF para lo anterior y copiar el cuerpo, se obtiene la siguiente cadena:
A dissertaƟon submiƩed in parƟal fulĮlment of the requirements for the degree of
Si elimino la inclusión de la fuente, copiar y pegar funciona bien, así que tengo motivos para creer que es un problema con la forma en que uso la fuente. Alguien tiene alguna idea
Respuesta1
No utilice inputenc
, lmodern
y cmap
con fontenc
XeLaTeX o LuaLaTeX. Pero además de esto es un problema con las ligaduras. No están asignados correctamente a entradas Unicode con XeLaTeX. Con LuaLaTeX funciona:
\documentclass[12pt,a4paper,english]{report}
\usepackage[british,english]{babel}
\usepackage{fontspec}
\setmainfont{Calibri.ttf}
\begin{document}
{\large A dissertation submitted in partial fulfilment of\\
the requirements for the degree of\par}
\end{document}
XeLaTeX:
una diserta