Por que o pdflatex grava no arquivo toc \cyr-commands mesmo com codificação de documento utf8?

Por que o pdflatex grava no arquivo toc \cyr-commands mesmo com codificação de documento utf8?

Por que pdflatex(mas não lualatex) grava \cyrcomandos toc-file mesmo com utf8codificação de documento em vez de letras cirílicas normais? Como prevenir isso? Estou interessado em solução com redefinição book.clsde comandos. Eu redefini o \addcontentsline{toc}{part}{\unexpanded\expandafter{{#1}}}%mas não tem resultado.

% !TeX program = pdflatex
% !TeX encoding = utf8
% !TeX spellcheck = uk_UA
% !BIB program = bibtex8

\documentclass[12pt]{book}

\usepackage[a4paper]{geometry}

\usepackage[utf8]{inputenc}
\usepackage[T2A,T1]{fontenc}
\usepackage[ukrainian]{babel}

\usepackage{indentfirst}
\usepackage{misccorr}

\makeatletter
\def\@part[#1]#2{%
    \thispagestyle{empty}
    \addcontentsline{toc}{part}{\unexpanded\expandafter{{#1}}}%
    {\centering
        \interlinepenalty \@M
        \normalfont
        \Huge \sffamily\bfseries #1\par}%
    \@endpart
}
\makeatother

\begin{document}
\tableofcontents
\part{Перша}

іва
\part{Друга}
іфавіфав
\end{document}

Tocparece

\select@language {ukrainian}
\contentsline {part}{{\IeC {\CYRP }\IeC {\cyre }\IeC {\cyrr }\IeC {\cyrsh }\IeC {\cyra }}}{3}
\contentsline {part}{{\IeC {\CYRD }\IeC {\cyrr }\IeC {\cyru }\IeC {\cyrg }\IeC {\cyra }}}{7}

Responder1

Você pode tentar com \detokenize.

Para uso com : é hyperrefnecessário tanto no patch do .\texorpdfstring\phantomsection\@part

\documentclass[12pt]{book}

\usepackage[a4paper]{geometry}

\usepackage[T2A,T1]{fontenc}

\usepackage[utf8]{inputenc}

\usepackage[ukrainian]{babel}

\usepackage{indentfirst}
\usepackage{misccorr}

% update for hyperref compatibility

\makeatletter
\def\@part[#1]#2{%
    \thispagestyle{empty}%
    \phantomsection
    \addcontentsline{toc}{part}{\texorpdfstring{\detokenize{#1}}{#1}}%
    {\centering
        \interlinepenalty \@M
        \normalfont
        \Huge \sffamily\bfseries #1\par
    }%
    \@endpart
}
\makeatother

\usepackage[pdfencoding=auto]{hyperref}

\begin{document}
\tableofcontents
\part{Перша}

іва
\part{Друга}
іфавіфав
\end{document}

Conteúdo do arquivo toc:

\select@language {ukrainian}
\contentsline {part}{Перша}{3}
\contentsline {part}{Друга}{7}

e com hyperref:

\select@language {ukrainian}
\contentsline {part}{Перша}{3}{section*.2}
\contentsline {part}{Друга}{7}{section*.3}

Responder2

Em princípio, pelo menos diferentes partes do documento podem usar diferentes codificações de entrada, portanto o mecanismo foi projetado para sempre gravar arquivos auxiliares na codificação de LICRmarcação ASCII neutra.

Na prática, especialmente se você estiver usando UTF-8, uma única codificação é usada para todo o documento, mas o suporte a UTF-8 e UTF-8 no LaTeX é alguns anos mais novo que o design do suporte de codificação para arquivos toc.

informação relacionada