특정 순서를 따르는 단어를 찾는 방법

Question 1

#!/bin/sh
pttrn="^$(printf '%s' "$1" | sed -e 's/\(.\)/\1*/g' -e 's/\*/\\+/' -e 's/\*$/\\+/')"'$'
grep "$pttrn" /usr/share/dict/words

*각 문자 뒤에 삽입하여 첫 번째 인수에서 패턴을 얻습니다 . 그런 다음 첫 번째 *는 \+; 마지막도 마찬가지다 *. 추가적으로 ^및 $추가됩니다. 예제 입력은 다음 패턴을 생성합니다.

^q\+w*e*r*t*y*u*y*t*r*e*s*d*f*t*y*u*i*o*k*n\+$

이 패턴은 에 적합한 패턴입니다 grep. q시작 부분에 한 번 이상 나타나야 하고 n끝 부분에도 한 번 이상 나타나야 합니다. 중간에 있는 각 문자는 0번 이상 나타날 수 있으며 순서가 유지됩니다.

스크립트가 멍청하다는 점에 유의하세요. ., 등으로 입력을 제공하면 사양을 넘어서는 정규식을 얻게 [됩니다 . ]올바른 입력을 제공하거나 스크립트를 확장하여 유효성을 검사하세요.

예:

$ ./script1.sh qwertyuytresdftyuiokn
queen
question
$ ./script1.sh te
tee
$ ./script1.sh superuser
seer
serer
spur
super
supper
surer
$

Answer

#!/bin/sh
pttrn="^$(printf '%s' "$1" | sed -e 's/\(.\)/\1*/g' -e 's/\*/\\+/' -e 's/\*$/\\+/')"'$'
grep "$pttrn" /usr/share/dict/words

*각 문자 뒤에 삽입하여 첫 번째 인수에서 패턴을 얻습니다 . 그런 다음 첫 번째 *는 \+; 마지막도 마찬가지다 *. 추가적으로 ^및 $추가됩니다. 예제 입력은 다음 패턴을 생성합니다.

^q\+w*e*r*t*y*u*y*t*r*e*s*d*f*t*y*u*i*o*k*n\+$

이 패턴은 에 적합한 패턴입니다 grep. q시작 부분에 한 번 이상 나타나야 하고 n끝 부분에도 한 번 이상 나타나야 합니다. 중간에 있는 각 문자는 0번 이상 나타날 수 있으며 순서가 유지됩니다.

스크립트가 멍청하다는 점에 유의하세요. ., 등으로 입력을 제공하면 사양을 넘어서는 정규식을 얻게 [됩니다 . ]올바른 입력을 제공하거나 스크립트를 확장하여 유효성을 검사하세요.

예:

$ ./script1.sh qwertyuytresdftyuiokn
queen
question
$ ./script1.sh te
tee
$ ./script1.sh superuser
seer
serer
spur
super
supper
surer
$

Question 2

여기에 접근하는 한 가지 방법이 있습니다.

먼저, 뒤죽박죽과 동일한 문자로 시작하고 끝나는 단어로 단어 목록을 필터링합니다. 예를 들어, 뒤죽박죽이 위치 매개변수로 전달되는 경우 $1(최근 쉘을 가정 bash)

grep -x "${1:0:1}.*${1:(-1):1}" /usr/share/dict/words

그런 다음 이 단어 각각을 정규 표현식으로 분해하세요. "좋은" 방법은 생각나지 않지만, 예를 들어 GNU sed를 사용하면 할 수 있습니다.

$ sed -E 's/(.)\1*/+.*\1/2g' <<< "queen"
q+.*u+.*e+.*n

이제 생성된 각 패턴에 대해 뒤죽박죽을 테스트합니다.

함께 모아서:

$ cat script1 
#!/bin/bash

wordlist=/usr/share/dict/words

while IFS= read -r word; do 
  grep -qEx "$(sed -E 's/(.)\1*/+.*\1/2g' <<< "$word")" <<< "$1" && printf '%s\n' "$word"
done < <(grep -x "${1:0:1}.*${1:(-1):1}" "$wordlist")

그 다음에

$ ./script1 qwertyuytresdftyuiokn
queen
question

Answer