Encontrando a forma completa do acrônimo entre parênteses usando regex

Question

Supondo que você esteja usando Python:

((\w)\w* )(\w* ){0,3}\((?i)(\2)[^)]*\)

Este captura o primeiro caractere de uma palavra no grupo 2. Esta palavra é seguida por zero a três palavras (aumente o número se for adequado). Todas as palavras são delimitadas por um espaço literal. O próximo é um colchete aberto seguido pela letra capturada no grupo 2, que não faz distinção entre maiúsculas e minúsculas. Tudo isso é seguido pelo resto do padrão de colchetes.

Não consegui combinar o número de palavras com o número de caracteres da sigla, portanto uma de suas condições não foi atendida.

Meus comentários foram muito pessimistas. Mas vai pegar muita bobagem.

Testado em regex101.com

A propósito, você pode ajustar o padrão de colchetes e usar \([^)]*\). Caracteres negados com multiplicador ganancioso não precisam de referência retroativa, portanto o processo funciona mais rápido.

Answer 1