
Essa questãomostra como contar o número de ocorrências de um caractere específico em uma string. Gostaria de fazer isso de forma expansível e para uma lista (não apenas uma) de caracteres específicos.
\documentclass{article}
\usepackage{xparse}
\ExplSyntaxOn
\NewExpandableDocumentCommand{\countsep}{r[] m}{
% CODE HERE
}
\ExplSyntaxOff
\begin{document}
\countsep[-+]{This-is-a+test} % Count the number of - and + in the string (3)
\countsep[-+]{T+h+i+s-is-a-test} % Count the number of - and + in the string (6)
\end{document}
Responder1
\documentclass{article}
\def\countsep#1#2{\the\numexpr0\countsepy#1\Endlist#2\Endcount}
\def\countsepy#1#2\Endlist#3\Endcount{\countsepz#1#3\Endcount
\ifx\relax#2\relax\relax\else\countsepy#2\Endlist#3\Endcount\fi}
\def\countsepz#1#2#3\Endcount{\ifx#1#2+1\fi
\ifx\relax#3\relax\else\countsepz#1#3\Endcount\fi}
\begin{document}
\countsep{-}{This-is-a+test} % Count the number of - in the string (2)
\countsep{+}{This-is-a+test} % Count the number of + in the string (1)
\countsep{-+}{This-is-a+test} % Count the number of - and + in the string (3)
\edef\z{\countsep{-+}{T+h+i+s-is-a-test}}
\z
\end{document}
Responder2
Aqui está uma solução baseada em LuaLaTeX para \countsep
. A solução é um simples refinamento de umsoluçãoeu dei para oconsulta anteriormencionado na postagem do OP. Observe que \countsep
é expansível porque \directlua
e \luastring
são expansíveis.
Observe ainda que tanto a string de pesquisa quanto a string de destino podem incluir caracteres gerais codificados em UTF8.
% !TEX TS-program = lualatex
\documentclass{article}
\usepackage{luacode} % for '\luastring' macro
\newcommand\countsep[2]{\directlua{%
_ , count = unicode.utf8.gsub ( "#2" , "["..\luastring{#1}.."]" , "" )
tex.sprint ( count ) }}
\def\yy{äÖÜß}
\def\zz{ßT+h+i+s-is-a-testäÖÜß}
\edef\z{\countsep{\yy}{\zz}}
\begin{document}
\countsep{""}{This-is-a+test} % result: 0
\countsep{-+}{This-is-a+test} % result: 3
\countsep{-+}{T+h+i+s-is-a-test} % result: 6
\countsep{\yy}{\zz\zz} % result: 10
\z % result: 5
\end{document}
Responder3
O seguinte implementa isso em L3 usando etl
. Ele usa o argumento obrigatório entre colchetes da sua pergunta, embora eu aconselhe fortemente contra isso. O uso de argumentos não padrão é desencorajado por um motivo, []
geralmente é um argumento opcional, o que não é, e não vejo nenhum bom motivo para a sobrecarga de análise aqui.
Coisas a mencionar:
- isso pressupõe que você deseja realmente contar ocorrências em uma lista de tokens (sem stringificação)
- isso pressupõe que os separadores entre colchetes devem ser contados (se não, altere o aninhado
+ \vincent_count_tokens_in:nn
para\use_none:nn
) - Isto conta corretamente se um dos separadores especificados for um espaço
- Isto não funciona para símbolos separadores não-ASCII em motores não-UTF8 (pdfTeX), caso contrário funciona em todos os motores
\documentclass{article}
\usepackage{xparse, etl}
\ExplSyntaxOn
\etl_new_if_in:Nnn \__vincent_if_contains_space:n { ~ } { T }
\cs_new:Npn \vincent_count_tokens_in:nn #1#2
{
\int_eval:w 0
\etl_act:nennn
\__vincent_count_tokens_in:nN
{
\__vincent_if_contains_space:nT {#1} { + \c_one_int }
\use_none:n
}
{ + \vincent_count_tokens_in:nn }
{#1}
{#2}
\scan_stop:
}
\cs_generate_variant:Nn \etl_act:nnnnn { ne }
\cs_new:Npn \__vincent_count_tokens_in:nN #1#2
{ \etl_token_if_in:nNT {#1} #2 { + \c_one_int } }
\NewExpandableDocumentCommand{\countsep}{r[] m}
{ \vincent_count_tokens_in:nn {#1} {#2} }
\ExplSyntaxOff
\begin{document}
\countsep[-+]{This-is-a+test} % Count the number of - and + in the string (3)
\countsep[- +]{T+h+i+s is{-a-}test} % Count the number of -, space and + in the string (6)
\end{document}
Além: isso não é particularmente rápido, pois etl
precisa verificar espaços e grupos para cada elemento da lista, por isso faz muito mais em segundo plano do que a solução de @StevenB.Segletes, isso só é necessário se você realmente quiser poder contar espaços e/ou recursar em grupos.