
Bei einem gegebenen LaTeX-Dokument möchte ich eine automatische Methode verwenden, um herauszufinden, welches von allen Labels am häufigsten referenziert wird, welches am zweithäufigsten referenziert wird und so weiter. Ich gebe Ihnen ein Beispiel, um es zu verdeutlichen. Angenommen, wir haben dieses Dokument:
\documentclass{article}
\usepackage{amsthm}
\theoremstyle{plain}
\newtheorem{theorem}{Theorem}
\newtheorem{lemma}{Lemma}
\begin{document}
\begin{lemma}
\label{lm:1} Content of the first lemma.
\end{lemma}
Using lemma~\ref{lm:1} we have the following:
\begin{lemma}
\label{lm:2} Content of the second lemma.
\end{lemma}
Another consequence of lemma~\ref{lm:3} is the following:
\begin{lemma}
\label{lm:3} Content of the third lemma.
\end{lemma}
Finally, combining lemmas~\ref{lm:1},~\ref{lm:2},~\ref{lm:3} we have the following:
\begin{theorem}
\label{th:1}
\end{theorem}
\end{document}
In diesem Fall möchte ich die folgende Liste sehen:
lm:1
lm:3
lm:2
th:1
Da auf lm:1 und lm:2 beide zweimal verwiesen wird, ist auch die folgende Liste akzeptabel:
lm:3
lm:1
lm:2
th:1
Ich brauche nicht jede mögliche Liste, eine davon reicht.
Bearbeiten: Was wäre, wenn wir beim Erstellen einer solchen Liste jedes Label ignorieren möchten, das mit einem bestimmten Präfix beginnt? Angenommen, wir möchten im vorherigen Beispiel jedes Label ignorieren, das mit „lm“ beginnt. Dann wäre die gewünschte Ausgabe die folgende:
- th:1
Antwort1
Hier ist eine Möglichkeit:
\documentclass{article}
\usepackage{amsthm}
\usepackage{pgffor}
\theoremstyle{plain}
\newtheorem{theorem}{Theorem}
\newtheorem{lemma}{Lemma}
\let\oldref\ref
\let\oldlabel\label
\newcounter{labls}
\makeatletter
\def\ref#1{%
\@ifundefined{refrs@#1}{\xdef\temp{1}\expandafter\expandafter\expandafter\global\expandafter\let\csname refrs@#1\endcsname\temp}{%
\xdef\temp{\expandafter\expandafter\expandafter\number\expandafter\numexpr\csname refrs@#1\endcsname+1\relax}\expandafter\expandafter\expandafter\global\expandafter\let\csname refrs@#1\endcsname\temp\oldref{#1}}%
}
\def\label#1{%
\@ifundefined{labls@#1}
{\stepcounter{labls}}%
{Error:Already Defined Label: #1}
\@ifundefined{refrs@#1}{\xdef\temp{0}\expandafter\expandafter\expandafter\global\expandafter\let\csname refrs@#1\endcsname\temp}{\relax}%
\xdef\temp{#1}%
\expandafter\expandafter\expandafter\global\expandafter\let\csname LabelName\arabic{labls}\endcsname\temp\oldlabel{#1}%
}
\makeatother
\newcommand\reflist[1][]{%
\foreach\i in {1,...,\value{labls}}{%
\expandafter\expandafter\expandafter\global\expandafter\let\csname printed\i\endcsname\undefined%
}%
\foreach\k in {1,...,\value{labls}}{%
\xdef\maxRefs{-1}%
\xdef\printLabelNum{\k}%
\xdef\printLabelName{\csname LabelName\k\endcsname}%
\foreach \l in {1,...,\value{labls}}{%
\xdef\CurLabel{\csname LabelName\l\endcsname}%
\xdef\CurNum{\l}%
\xdef\CurRefs{\csname refrs@\CurLabel\endcsname}%
\ifnum\CurRefs > \maxRefs
\ifcsname printed\l\endcsname
\relax
\else
\xdef\maxRefs{\CurRefs}%
\xdef\printNum{\l}%
\fi
\fi
}%
{\bfseries \k)\csname LabelName\printNum\endcsname\xdef\t{#1}\ifx\t\empty\relax\else:~\maxRefs\fi\ifnum\k<\value{labls}\\\fi}%
\expandafter\expandafter\expandafter\global\expandafter\let\csname printed\printNum\endcsname\maxRefs%
}%
}
\begin{document}
\begin{lemma}
\label{lm:1} Content of the first lemma.
\end{lemma}
Using lemma~\ref{lm:1} we have the following:
\begin{lemma}
\label{lm:2} Content of the second lemma.
\end{lemma}
Another consequence of lemma~\ref{lm:3} is the following:
\begin{lemma}
\label{lm:3} Content of the third lemma.
\end{lemma}
Finally, combining lemmas~\ref{lm:1},~\ref{lm:2},~\ref{lm:3} we have the following:
\begin{theorem}
\label{th:1}
\end{theorem}
\noindent\reflist\vspace{1cm}
%You may add a non empty optional argument to print the appearances
\noindent\reflist[ ]
\end{document}
Antwort2
Für diese Art von Anwendung finde ich es oft einfacher, eine Skriptsprache zu verwenden, die die Textdatei analysiert. Hier ist ein Beispiel mit Unix-Tools, bei dem Ihre Datei den Namen hatdoc.tex
sed "s:\}:\}\n:g" doc.tex |\
sed -rn "s:.*ref\{(.*)\}.*:\1:p" |\
sort | uniq --count
Dies gibt
2 lm:1
1 lm:2
2 lm:3
Die Sie dann sortieren können, indem Sie sie weiterleiten ansort -r
Der erste sed-Befehl fügt nach } eine neue Zeile ein, der folgende Befehl entspricht dem \ref{}-Muster, aber nur einmal pro Zeile, weshalb der vorherige Befehl verwendet wird. Die nachfolgenden Befehle sind selbsterklärend.
Um Labels zu ignorieren, können Sie entweder den regulären Ausdruck spezifischer machen oder die Ausgabe oben filtern