Уточнение grep и регулярных выражений

Question 1

Вашу проблему (ИМХО) лучше решить с помощью awk, но я просто укажу на проблему с вашей командой

grep -E '^.{10}$'| grep 'a*.e*.i*.o*.u*' words2.txt

Чтобы отфильтровать содержимое файла word2.txtчерез оба grepвызова, это должно выглядеть так:

grep -E '^.{10}$' words2.txt | grep 'a*.e*.i*.o*.u*'

Второй grepшаблон должен быть таким [auoie]{3}, что приводит нас к

grep -E '^.{10}$' words2.txt | grep -E '[aouie]{3}'

Вход для первого grep— ваш файл. Вход для второго grep— выход первого grep,нетваш файл.

Используя POSIX awk(например, последние версии GNU awk):

$ awk 'length == 10 && /[aouei]{3}/' words2.txt
unpervious
unplebeian
unportuous
unprecious
unquailing
unqueening
unquieting
unquietude

mawk, BSD awkи исторические реализации до POSIX awkне поддерживают {n}регулярные выражения, какотметил Стефан Шазелас.

Answer

Вашу проблему (ИМХО) лучше решить с помощью awk, но я просто укажу на проблему с вашей командой

grep -E '^.{10}$'| grep 'a*.e*.i*.o*.u*' words2.txt

Чтобы отфильтровать содержимое файла word2.txtчерез оба grepвызова, это должно выглядеть так:

grep -E '^.{10}$' words2.txt | grep 'a*.e*.i*.o*.u*'

Второй grepшаблон должен быть таким [auoie]{3}, что приводит нас к

grep -E '^.{10}$' words2.txt | grep -E '[aouie]{3}'

Вход для первого grep— ваш файл. Вход для второго grep— выход первого grep,нетваш файл.

Используя POSIX awk(например, последние версии GNU awk):

$ awk 'length == 10 && /[aouei]{3}/' words2.txt
unpervious
unplebeian
unportuous
unprecious
unquailing
unqueening
unquieting
unquietude

mawk, BSD awkи исторические реализации до POSIX awkне поддерживают {n}регулярные выражения, какотметил Стефан Шазелас.

Question 2

Вы правильно назвали 10 символов, но чтобы найти 3 гласные подряд, ищите группу [AEIOU]:

egrep '^.{10}$' | egrep -i '[AEIOU]{3}'

Чтобы отклонить whitespace, используйте это:

egrep '^[^ \t]{10}$' | egrep -i '[AEIOu]{3}'

Answer

Вы правильно назвали 10 символов, но чтобы найти 3 гласные подряд, ищите группу [AEIOU]:

egrep '^.{10}$' | egrep -i '[AEIOU]{3}'

Чтобы отклонить whitespace, используйте это:

egrep '^[^ \t]{10}$' | egrep -i '[AEIOu]{3}'

Question 3

Если предположить, что это 1 слово/строка, то можно сделать следующее:

sed -nE '/^.{10}$/!d;/[aAeEiIoOuU]{3}/p' words.txt

Answer

Если предположить, что это 1 слово/строка, то можно сделать следующее:

sed -nE '/^.{10}$/!d;/[aAeEiIoOuU]{3}/p' words.txt

Question 4

Со grepвстроенной поддержкой PCRE:

grep -iPx '(?=.*[aeiou]{3}.*).{10}'

Или:

grep -wiP '(?=\w*[aeiou]{3}\w*)\w{10}'

для поиска этих слов, когда они не находятся по одному в строке (добавьте, -oесли ваша grepреализация поддерживает это, чтобы выводить только совпадающие слова, а не всю строку, в которой они найдены).словоозначает любую последовательностьсловосимволы (буквы (только латинского алфавита, без диакритических знаков, (*UCP)для букв любого алфавита добавляйте a, хотя это все равно не будет охватывать гласные, такие как éили α), цифры и подчеркивание).

Answer

Со grepвстроенной поддержкой PCRE:

grep -iPx '(?=.*[aeiou]{3}.*).{10}'

Или:

grep -wiP '(?=\w*[aeiou]{3}\w*)\w{10}'

для поиска этих слов, когда они не находятся по одному в строке (добавьте, -oесли ваша grepреализация поддерживает это, чтобы выводить только совпадающие слова, а не всю строку, в которой они найдены).словоозначает любую последовательностьсловосимволы (буквы (только латинского алфавита, без диакритических знаков, (*UCP)для букв любого алфавита добавляйте a, хотя это все равно не будет охватывать гласные, такие как éили α), цифры и подчеркивание).

Уточнение grep и регулярных выражений

решение1

решение2

решение3

решение4

Связанный контент