У меня есть строка, состоящая из нескольких подстрок, разделенных подчеркиваниями. Например: AbcdAEfd_hEgdgE_AbAAAAA
. Мне нужно удалить все гласные, кроме первой, из каждой подстроки. Итак:
AbcdAEfd
->Abcdfd
hEgdgE
->hEgdg
AbAAAAA
->Ab
Результирующая строка должна бытьAbcdfd_hEgdg_Ab
решение1
Решение на чистом bash, использующее только замену параметров:
#! /bin/bash
suffix=${1#*[aeiou]}
prefix=${1%$suffix}
vowel=${prefix: -1}
prefix=${prefix%?} # Remove the vowel from the prefix
suffix=${suffix//[aeiou]/} # Remove the vowels.
echo "$1 -> $prefix$vowel$suffix."
решение2
Вы можете использовать perl
'sпросмотр назад нулевой шириныСинтаксис регулярных выражений.
perl -pe "s/(?<=[aeiou])([^aeiou_]*)[aeiou]([^aeiou_]*)/\1\2/ig"
Следующий фрагмент обрабатывает входную строку как одну строку (а не как несколько подстрок).
perl -pe "s/(?<=[aeiou])([^aeiou]*)[aeiou]/\1/ig"
решение3
А python считается? Это должно сработать:
cat anonymous.txt | python -c "import sys; x=sys.stdin.read(); print(x[0]+''.join([z for z in x[1:] if z not in 'AEIOUaeiou']))"
Я также пробовал использовать тройник и именованные каналы, но это не сработало:
makefifo pipe; cat anonymous.txt | tee >(cut -b1 >> pipe&) >(cut -b1- | tr -d aeiouAEIOU >> pipe&) > /dev/null; cat pipe | xargs -d '\n'
решение4
Это может вам подойти (GNU sed):
sed 's/^/\n/;ta;:a;s/\n$//;t;s/\n\([^aeiou_]*[aeiou]\)/\1\n/i;:b;s/\n\([^aeiou_]*\)[aeiou]/\1\n/i;tb;s/\n\([^aeiou]*\)/\1\n/i;ta' file