Beim Kopieren von Text aus PDF werden griechische Zeichen eingefügt

Beim Kopieren von Text aus PDF werden griechische Zeichen eingefügt

Ich habe ein Problem: Wenn ich Wörter aus einer PDF-Datei (erstellt mit XeLaTeX) kopiere, enthält der kopierte Text zufällige griechische Zeichen.

\documentclass[12pt,a4paper,english]{report}
% setup encoding
\usepackage[utf8]{inputenc}
%set language
\usepackage[british,english]{babel}
\usepackage[T1]{fontenc}
\usepackage{lmodern,cmap}
%setup font
\usepackage{fontspec}
\setmainfont{Calibri}

\begin{document}
{\large A dissertation submitted in partial fulfilment of\\
the requirements for the degree of\\}
\end{document}

(Der Einfachheit halber habe ich den Text weggelassen.)

Wenn Sie für das Obige ein PDF erstellen und den Textkörper kopieren, erhalten Sie die folgende Zeichenfolge:

A dissertaƟon submiƩed in parƟal fulĮlment of the requirements for the degree of

Wenn ich die Schriftarteinbindung entferne, funktioniert das Kopieren und Einfügen einwandfrei. Ich habe also Grund zu der Annahme, dass es ein Problem mit der Art und Weise ist, wie ich die Schriftart verwende? Hat jemand eine Idee?

Antwort1

Verwenden Sie inputenc, lmodern, cmapund nicht fontencmit XeLaTeX oder LuaLaTeX. Außerdem gibt es ein Problem mit den Ligaturen. Sie werden mit XeLaTeX nicht korrekt auf Unicode-Einträge abgebildet. Mit LuaLaTeX funktioniert es:

\documentclass[12pt,a4paper,english]{report}
\usepackage[british,english]{babel}

\usepackage{fontspec}
\setmainfont{Calibri.ttf}

\begin{document}
{\large A dissertation submitted in partial fulfilment of\\
the requirements for the degree of\par}
\end{document} 

XeLaTeX:

Eine Dissertation

verwandte Informationen