найти последовательности, которые находятся в алфавитном порядке

Question 1

Один из вариантов, жестко запрограммированный для английского языка:

grep -ix 'a*b*c*d*e*f*g*h*i*j*k*l*m*n*o*p*q*r*s*t*u*v*w*x*y*z*' input

Кредит дляNinjaBearMonkeyдля изложения идеи, которая зарождалась в моей голове; я изменил регулярное выражение, чтобы разрешить повторяющиеся символы ( aabcc).

Другой вариант:

Использование sortдля проверки порядка сортировки, специфичного для локали, является лучшим способом, так как вам не придется жестко кодировать алфавит.МайкДжонси сделал, это означает, что вам нужно разбить символы строки на отдельные строки. Я сделал это с помощью скрипта оболочки (используя современную оболочку, которая поддерживает расширение подстрок), чтобы избежать вызова sed, и который также использует sortопцию -c для указания того, отсортирован ли уже ввод или нет:

while IFS= read -r line
do
  for((i=0; i < ${#line}; i++))
  do
    printf '%s\n' "${line:i:1}"
  done | sort -c 2>/dev/null && printf '%s\n' "$line"
done

Если sortобнаруживается несоответствие, вывод выполняется в stderr, но нас интересует только код возврата, поэтому я пропускаю stderr.

Демонстрация с неанглийским вводом ( $символы — это подсказки оболочки):

$ cat input
αβγα
αβγ
$ ./sorted2 < input
αβγ
$

Answer

Один из вариантов, жестко запрограммированный для английского языка:

grep -ix 'a*b*c*d*e*f*g*h*i*j*k*l*m*n*o*p*q*r*s*t*u*v*w*x*y*z*' input

Кредит дляNinjaBearMonkeyдля изложения идеи, которая зарождалась в моей голове; я изменил регулярное выражение, чтобы разрешить повторяющиеся символы ( aabcc).

Другой вариант:

Использование sortдля проверки порядка сортировки, специфичного для локали, является лучшим способом, так как вам не придется жестко кодировать алфавит.МайкДжонси сделал, это означает, что вам нужно разбить символы строки на отдельные строки. Я сделал это с помощью скрипта оболочки (используя современную оболочку, которая поддерживает расширение подстрок), чтобы избежать вызова sed, и который также использует sortопцию -c для указания того, отсортирован ли уже ввод или нет:

while IFS= read -r line
do
  for((i=0; i < ${#line}; i++))
  do
    printf '%s\n' "${line:i:1}"
  done | sort -c 2>/dev/null && printf '%s\n' "$line"
done

Если sortобнаруживается несоответствие, вывод выполняется в stderr, но нас интересует только код возврата, поэтому я пропускаю stderr.

Демонстрация с неанглийским вводом ( $символы — это подсказки оболочки):

$ cat input
αβγα
αβγ
$ ./sorted2 < input
αβγ
$

Question 2

Для полноты картины приведем awkрешение на основе , в котором обычные отношения шаблона и данных меняются местами:

awk 'BEGIN{ref="abcdefghijklmnopqrstuvwxyz"} ref ~ $0' file.txt

Это интерпретирует строки в файле как регулярные выражения, с которыми сопоставляется «справочная» строка отсортированных символов от aдо z. Только если есть совпадение (что означает, что строка в строке является подстрокой a ... z), строка будет напечатана.

Answer

Для полноты картины приведем awkрешение на основе , в котором обычные отношения шаблона и данных меняются местами:

awk 'BEGIN{ref="abcdefghijklmnopqrstuvwxyz"} ref ~ $0' file.txt

Это интерпретирует строки в файле как регулярные выражения, с которыми сопоставляется «справочная» строка отсортированных символов от aдо z. Только если есть совпадение (что означает, что строка в строке является подстрокой a ... z), строка будет напечатана.

Question 3

perl -MPOSIX -Mopen=locale -lne '
   print unless m{(.)(.)(?(?{strcoll($1, $2) < 0})(*FAIL))}' < file

Будут напечатаны строки, fileза исключением тех, которые содержат символ, который не следует за предыдущим в локали пользователя.

Answer

perl -MPOSIX -Mopen=locale -lne '
   print unless m{(.)(.)(?(?{strcoll($1, $2) < 0})(*FAIL))}' < file

Будут напечатаны строки, fileза исключением тех, которые содержат символ, который не следует за предыдущим в локали пользователя.

Question 4

cat homework.txt | while read aline; do 
    stringORIG=$(echo -n "$aline" | sed 's/\(.\)/\1\n/g')
    stringABC=$(echo -n "$aline" | sed 's/\(.\)/\1\n/g' | sort)
    if [ "$stringORIG" == "$stringABC" ]; then
        echo "$aline"
    fi
done

.

abcdef
pqrs

ps... если вы не хотите использовать команду сортировки, вы можете преобразовать каждый символ в целое число и использовать оператор if для проверки того, что последний символ меньше следующего...

Answer

cat homework.txt | while read aline; do 
    stringORIG=$(echo -n "$aline" | sed 's/\(.\)/\1\n/g')
    stringABC=$(echo -n "$aline" | sed 's/\(.\)/\1\n/g' | sort)
    if [ "$stringORIG" == "$stringABC" ]; then
        echo "$aline"
    fi
done

.

abcdef
pqrs

ps... если вы не хотите использовать команду сортировки, вы можете преобразовать каждый символ в целое число и использовать оператор if для проверки того, что последний символ меньше следующего...

найти последовательности, которые находятся в алфавитном порядке

решение1

решение2

решение3

решение4

Связанный контент