Eu tenho uma string composta por várias substrings, separadas por sublinhados. Por exemplo: AbcdAEfd_hEgdgE_AbAAAAA
. Preciso remover todas as vogais, exceto a primeira, de cada substring. Então:
AbcdAEfd
->Abcdfd
hEgdgE
->hEgdg
AbAAAAA
->Ab
A string resultante deve serAbcdfd_hEgdg_Ab
Responder1
Solução bash pura, usando apenas substituição de parâmetros:
#! /bin/bash
suffix=${1#*[aeiou]}
prefix=${1%$suffix}
vowel=${prefix: -1}
prefix=${prefix%?} # Remove the vowel from the prefix
suffix=${suffix//[aeiou]/} # Remove the vowels.
echo "$1 -> $prefix$vowel$suffix."
Responder2
Você pode usar perl
'slook-behind de largura zerosintaxe regex.
perl -pe "s/(?<=[aeiou])([^aeiou_]*)[aeiou]([^aeiou_]*)/\1\2/ig"
O próximo trecho trata uma linha de entrada como uma única string (não como várias substrings).
perl -pe "s/(?<=[aeiou])([^aeiou]*)[aeiou]/\1/ig"
Responder3
Python conta? Isso deve funcionar:
cat anonymous.txt | python -c "import sys; x=sys.stdin.read(); print(x[0]+''.join([z for z in x[1:] if z not in 'AEIOUaeiou']))"
Eu tentei com tee e pipes nomeados também, mas falhou:
makefifo pipe; cat anonymous.txt | tee >(cut -b1 >> pipe&) >(cut -b1- | tr -d aeiouAEIOU >> pipe&) > /dev/null; cat pipe | xargs -d '\n'
Responder4
Isso pode funcionar para você (GNU sed):
sed 's/^/\n/;ta;:a;s/\n$//;t;s/\n\([^aeiou_]*[aeiou]\)/\1\n/i;:b;s/\n\([^aeiou_]*\)[aeiou]/\1\n/i;tb;s/\n\([^aeiou]*\)/\1\n/i;ta' file