Eficiência de xstring (2e) vs. xparse (l3) em análise simples

Eficiência de xstring (2e) vs. xparse (l3) em análise simples

Entendo que o processamento de strings pode ser feito LaTeX2eusando xstringe expl3usando xparse(originalmente baseado noTópico de 2013 "Tokenização e análise") Estarei executando uma macro de análise de string relativamente simples centenas de vezes em um documento, provavelmente em muitas compilações e muitos documentos, e gostaria de saber qual método é mais eficiente em termos de tempo e/ou computacionalmente, descontando o tempo fixo para carregar os pacotes .

Uma aproximação baseada em uma breve olhada no xstringcódigo de seria muito bem-vinda pela equipe 3e aqui. Não preciso de nada próximo de resultados exatos - isso é para minha própria curiosidade e apenas para ter certeza de que não vou tentar arranhar uma parede de tijolos em algum lugar.

Também estou interessado em opiniões sobre se este aplicativo é uma comparação útil dos algoritmos 2e e 3e.

Esta é a macro que estou usando xstring: é para dar um leve destaque à primeira letra (as duas primeiras letras desta demonstração) de cada menção a palavras-chave e frases, o que simplesmente desorganizaria a página se totalmente destacado:

\documentclass{article}
\usepackage{xstring}

%%% capitalize first n letters of each word %%%
% apply operator#3 to string#1 with word separators #2   
\newcommand{\Splitstrop}[3][ ]{%
  \providecommand\csA{}%
  \providecommand\csB{}%
  \StrCut{#3}{#1}\csA\csB%
  #2{\csA}%
  \ifx\csB\empty\else{#1}\Splitstrop[#1]{#2}{\csB}\fi\relax} 

% apply operation#3 on first #2 letters of string #1    
\newcommand{\Leftstrop}[3][1]{#2{\StrLeft{#3}{#1}}\StrGobbleLeft{#3}{#1}\relax}

\newcommand{\Kw}[1]{\textsc{#1}} %first mention of keyword/phrase
\newcommand{\Kwd}[1]{\Leftstrop[2]{\Kw}{#1}} %single-word 2nd mention: apply \Kw to first two letters of the word (I plan to sc just the first letter, but this is more illustrative)
\newcommand{\Kwds}[1]{\Splitstrop[ ]{\Kwd}{#1}} % keyphrase 2nd mention: apply Kwd to each word (space is word separator)


\begin{document}
Example: We define the \Kw{embiggen} \Kwd{operator} to raise the size of the \Kwd{argument} by one. 

This is a reminder not to \Kwds{beg the question} in your definitions (Sec. 2-1): don't say ``We define the \Kwd{embiggen} \Kwd{operator} as the \Kwd{operator} that \Kwd{embiggens}.''
\end{document}

saída de demonstração de análise simples xstring

Responder1

Eu tentei seu exemplo com l3benchmark:

\documentclass{article}
\usepackage{xstring,l3benchmark}

%%% capitalize first n letters of each word %%%
% apply operator#3 to string#1 with word separators #2   
\newcommand{\Splitstrop}[3][ ]{%
  \StrCut{#3}{#1}\csA\csB
  #2{\csA}%
  \ifx\csB\empty\else{#1}\Splitstrop[#1]{#2}{\csB}\fi\relax
}

% apply operation#3 on first #2 letters of string #1    
\newcommand{\Leftstrop}[3][1]{#2{\StrLeft{#3}{#1}}\StrGobbleLeft{#3}{#1}\relax}

\newcommand{\Kw}[1]{\textsc{#1}} %first mention of keyword/phrase
\newcommand{\Kwd}[1]{\Leftstrop[2]{\Kw}{#1}} %single-word 2nd mention: apply \Kw to first two letters of the word (I plan to sc just the first letter, but this is more illustrative)
\newcommand{\Kwds}[1]{\Splitstrop[ ]{\Kwd}{#1}} % keyphrase 2nd mention: apply Kwd to each word (space is word separator)

\ExplSyntaxOn
\cs_set_eq:NN \benchmark \benchmark:n
\ExplSyntaxOff


\begin{document}

\benchmark{
Example: We define the \Kw{embiggen} \Kwd{operator} to raise the size of the 
\Kwd{argument} by one. 

This is a reminder not to \Kwds{beg the question} in your definitions (Sec. 2-1): 
don't say ``We define the \Kwds{embiggen operator} as the \Kwd{operator} 
that \Kwd{embiggens}.''
}

\end{document}

e a expl3versão

\documentclass{article}
\usepackage{xparse,l3benchmark}

\ExplSyntaxOn
\NewDocumentCommand{\Kw}{m}
 {
  \kompootor_textsc:n { #1 }
 }
\NewDocumentCommand{\Kwd}{m}
 {
  \kompootor_split:Nnn \kompootor_textsc:n { 2 } { #1 }
 }
\NewDocumentCommand{\Kwds}{m}
 {
  \kompootor_splitstrop:nNn { ~ } \kompootor_textsc:n { #1 }
 }

\seq_new:N \l__kompootor_splitstrop_in_seq
\seq_new:N \l__kompootor_splitstrop_out_seq

\cs_new_protected:Nn \kompootor_splitstrop:nNn
 {
  \seq_set_split:Nnn \l__kompootor_splitstrop_in_seq { #1 } { #3 }
  \seq_set_map:NNn \l__kompootor_splitstrop_out_seq \l__kompootor_splitstrop_in_seq
   { \kompootor_leftstrop:Nn #2 { ##1 } }
  \seq_use:Nn \l__kompootor_splitstrop_out_seq { #1 }
 }
\cs_new_protected:Nn \kompootor_leftstrop:Nn
 {
  \kompootor_split:Nnn #1 { 2 } { #2 }
 }
\cs_new:Nn \kompootor_split:Nnn
 {
  #1 { \tl_range:nnn { #3 } { 1 } { #2 } }
  \tl_range:nnn { #3 } { #2+1 } { -1 }
 }
\cs_new_protected:Nn \kompootor_textsc:n { \textsc { #1 } }

\NewDocumentCommand{\benchmark}{+m}{\benchmark:n{#1}}
\ExplSyntaxOff

\begin{document}

\benchmark{
Example: We define the \Kw{embiggen} \Kwd{operator} to raise the size of the 
\Kwd{argument} by one. 

This is a reminder not to \Kwds{beg the question} in your definitions (Sec. 2-1): 
don't say ``We define the \Kwds{embiggen operator} as the \Kwd{operator} 
that \Kwd{embiggens}.''
}

\end{document}

O resultado é

0.00338 seconds (1.1e4 ops)

para a xstringimplementação e

0.00187 seconds (6.29e3 ops)

para a expl3implementação.

A saída é idêntica (removendo \benchmark):

xstringversão

insira a descrição da imagem aqui

expl3versão

insira a descrição da imagem aqui

informação relacionada