Estranheza do Bash Regex ao usar o operador =~

Estranheza do Bash Regex ao usar o operador =~

Considere este código:

s1="1,2,3,4"; \
s2="1,2,3"; \
sP='^(([1-9][0-9]{0,},){1,2}){1,2}$'; \
[[ "${s1}," =~  $sP ]] && echo "\$s1 matches"; \
[[ "${s2}," =~  $sP ]] && echo "\$s2 matches, but why?"

Estou perplexo com o motivo da correspondência da segunda string. Meu regex está com defeito? Supõe-se que corresponda a 2 ou 4 "elementos".

Responder1

Para corresponder a 1, 2 ou 4 elementos, o ERE deve ser modificado da seguinte forma:

s1="1,2,3,4" ;\
s2="1,2,3" ;\
s3="1" ;\
sP='^[1-9][0-9]{0,},$|^(([1-9][0-9]{0,},){2}){1,2}$' ;\
[[ "${s1}," =~  $sP ]] && printf "\$s1, matches\n" ;\
[[ "${s2}," =~  $sP ]] || printf "\$s2, does not match\n" ;\
[[ "${s3}," =~  $sP ]] && printf "\$s3 matches\n"

Seu ERE original poderia ser descrito iterativamente:

[1-9][0-9]{0,},corresponde a 1, ou 2, ou 3, ou 432, etc.

([1-9][0-9]{0,},){1,2}corresponde a qualquer sequência única ou duas consecutivas descritas acima: 1, ou 3, ou 1,2, ou 10, ou 10.432, etc.

(([1-9][0-9]{0,},){1,2}){1,2}corresponde a qualquer 1 ou 2 ocorrências da última sequência 1, ou 1,2, ou 1,2,3, etc.

informação relacionada