So finden Sie Wörter, die einer bestimmten Reihenfolge folgen

Question 1

#!/bin/sh
pttrn="^$(printf '%s' "$1" | sed -e 's/\(.\)/\1*/g' -e 's/\*/\\+/' -e 's/\*$/\\+/')"'$'
grep "$pttrn" /usr/share/dict/words

Aus dem ersten Argument wird ein Muster gewonnen, indem *nach jedem Zeichen ein eingefügt wird. Dann wird das erste *in geändert \+; ebenso das letzte *. Zusätzlich werden ^und $hinzugefügt. Ihre Beispieleingabe erzeugt das folgende Muster:

^q\+w*e*r*t*y*u*y*t*r*e*s*d*f*t*y*u*i*o*k*n\+$

Dieses Muster ist das richtige Muster für grep. qmuss mindestens einmal am Anfang vorkommen, nmuss mindestens einmal am Ende vorkommen. Jeder Buchstabe in der Mitte darf null oder mehrmals vorkommen, die Reihenfolge bleibt erhalten.

Beachten Sie, dass das Skript dumm ist. Wenn Sie die Eingabe mit ., [, ]oder so vornehmen, erhalten Sie einen regulären Ausdruck, der über die Spezifikation hinausgeht. Geben Sie eine sinnvolle Eingabe ein oder erweitern Sie das Skript, um es zu validieren.

Beispiele:

$ ./script1.sh qwertyuytresdftyuiokn
queen
question
$ ./script1.sh te
tee
$ ./script1.sh superuser
seer
serer
spur
super
supper
surer
$

Answer

#!/bin/sh
pttrn="^$(printf '%s' "$1" | sed -e 's/\(.\)/\1*/g' -e 's/\*/\\+/' -e 's/\*$/\\+/')"'$'
grep "$pttrn" /usr/share/dict/words

Aus dem ersten Argument wird ein Muster gewonnen, indem *nach jedem Zeichen ein eingefügt wird. Dann wird das erste *in geändert \+; ebenso das letzte *. Zusätzlich werden ^und $hinzugefügt. Ihre Beispieleingabe erzeugt das folgende Muster:

^q\+w*e*r*t*y*u*y*t*r*e*s*d*f*t*y*u*i*o*k*n\+$

Dieses Muster ist das richtige Muster für grep. qmuss mindestens einmal am Anfang vorkommen, nmuss mindestens einmal am Ende vorkommen. Jeder Buchstabe in der Mitte darf null oder mehrmals vorkommen, die Reihenfolge bleibt erhalten.

Beachten Sie, dass das Skript dumm ist. Wenn Sie die Eingabe mit ., [, ]oder so vornehmen, erhalten Sie einen regulären Ausdruck, der über die Spezifikation hinausgeht. Geben Sie eine sinnvolle Eingabe ein oder erweitern Sie das Skript, um es zu validieren.

Beispiele:

$ ./script1.sh qwertyuytresdftyuiokn
queen
question
$ ./script1.sh te
tee
$ ./script1.sh superuser
seer
serer
spur
super
supper
surer
$

Question 2

Hier ist eine Möglichkeit, es anzugehen

Filtern Sie zunächst die Wortliste auf die Wörter, die mit den gleichen Buchstaben beginnen und enden wie das Durcheinander. Wenn beispielsweise das Durcheinander als Positionsparameter übergeben wird $1(und eine aktuelle bashShell angenommen wird),

grep -x "${1:0:1}.*${1:(-1):1}" /usr/share/dict/words

Dann nehmen Sie jedes dieser Wörter und zerlegen es in einen regulären Ausdruck - mir fällt keine "schöne" Möglichkeit ein, das zu tun, aber mit GNU sed könnten Sie zum Beispiel

$ sed -E 's/(.)\1*/+.*\1/2g' <<< "queen"
q+.*u+.*e+.*n

Testen Sie nun das Durcheinander mit jedem generierten Muster.

Alles zusammen:

$ cat script1 
#!/bin/bash

wordlist=/usr/share/dict/words

while IFS= read -r word; do 
  grep -qEx "$(sed -E 's/(.)\1*/+.*\1/2g' <<< "$word")" <<< "$1" && printf '%s\n' "$word"
done < <(grep -x "${1:0:1}.*${1:(-1):1}" "$wordlist")

Dann

$ ./script1 qwertyuytresdftyuiokn
queen
question

Answer

Hier ist eine Möglichkeit, es anzugehen

Filtern Sie zunächst die Wortliste auf die Wörter, die mit den gleichen Buchstaben beginnen und enden wie das Durcheinander. Wenn beispielsweise das Durcheinander als Positionsparameter übergeben wird $1(und eine aktuelle bashShell angenommen wird),

grep -x "${1:0:1}.*${1:(-1):1}" /usr/share/dict/words

Dann nehmen Sie jedes dieser Wörter und zerlegen es in einen regulären Ausdruck - mir fällt keine "schöne" Möglichkeit ein, das zu tun, aber mit GNU sed könnten Sie zum Beispiel

$ sed -E 's/(.)\1*/+.*\1/2g' <<< "queen"
q+.*u+.*e+.*n

Testen Sie nun das Durcheinander mit jedem generierten Muster.

Alles zusammen:

$ cat script1 
#!/bin/bash

wordlist=/usr/share/dict/words

while IFS= read -r word; do 
  grep -qEx "$(sed -E 's/(.)\1*/+.*\1/2g' <<< "$word")" <<< "$1" && printf '%s\n' "$word"
done < <(grep -x "${1:0:1}.*${1:(-1):1}" "$wordlist")

Dann

$ ./script1 qwertyuytresdftyuiokn
queen
question

Question 3

Hier ist ein weiteres (ausgeführt in bash). Der pythonCode generiert den regulären Ausdruck und gibt ihn an weiter grep. grepAnschließend wird die Ausgabe des bewährten lookDienstprogramms bearbeitet, das eine binäre Suche durchführt, um alle Wörter zurückzuholen, die im Beispiel /usr/share/dict/wordsmit beginnen . Somit ist die zu durchsuchende Menge an Wörtern stark reduziert.qgrep

python3 -c 'import sys
arr = list(sys.argv[1])
print(*arr, sep="*")
' $1 | grep -x -f - <(look ${1:0:1})

Alternativ eine look+ python3Lösung, die reguläre Ausdrücke vermeidet

look q | ./finder.py "qwertyuytresdftyuiokn"

wobei finder.pygilt:

#!/usr/bin/env python3
import sys
from itertools import groupby

seek_word = sys.argv[1]
for word in sys.stdin:
    orig_word = word.strip()
    word = ''.join(k for k, g in groupby(orig_word)) 
    s_w = iter(seek_word)
    i_word = iter(word)
    if all(c in s_w for c in i_word) and not next(s_w, None):
        print(orig_word)

Answer

Hier ist ein weiteres (ausgeführt in bash). Der pythonCode generiert den regulären Ausdruck und gibt ihn an weiter grep. grepAnschließend wird die Ausgabe des bewährten lookDienstprogramms bearbeitet, das eine binäre Suche durchführt, um alle Wörter zurückzuholen, die im Beispiel /usr/share/dict/wordsmit beginnen . Somit ist die zu durchsuchende Menge an Wörtern stark reduziert.qgrep

python3 -c 'import sys
arr = list(sys.argv[1])
print(*arr, sep="*")
' $1 | grep -x -f - <(look ${1:0:1})

Alternativ eine look+ python3Lösung, die reguläre Ausdrücke vermeidet

look q | ./finder.py "qwertyuytresdftyuiokn"

wobei finder.pygilt:

#!/usr/bin/env python3
import sys
from itertools import groupby

seek_word = sys.argv[1]
for word in sys.stdin:
    orig_word = word.strip()
    word = ''.join(k for k, g in groupby(orig_word)) 
    s_w = iter(seek_word)
    i_word = iter(word)
    if all(c in s_w for c in i_word) and not next(s_w, None):
        print(orig_word)

So finden Sie Wörter, die einer bestimmten Reihenfolge folgen

Antwort1

Antwort2

Antwort3

verwandte Informationen