grep을 사용하는 가장 긴 공통 부분 문자열

Question 1

이것은 처음부터 일치하려고 시도합니다.

t=TMP_ABC_SEQ_NUM
for n in $(seq 0 ${#t})
do
  grep ${t:n} dictionary.txt && break
done

이는 시작 위치에 관계없이 가장 긴 시퀀스를 검색합니다.

for len in $(seq ${#t} -1 3)
do
   for start in $(seq 0 $((${#t}-len)))
   do
       grep ${t:start:len} dictionary.txt && break 2
   done
done

요구 사항: bash와 유사한 쉘, 여기에서 사용 가능:sh.exe, grep, sed, awk, bc, cat, tac, rev, col, cut 등과 같은 많은 GNU 유틸리티의 기본 win32 포트

Answer

이것은 처음부터 일치하려고 시도합니다.

t=TMP_ABC_SEQ_NUM
for n in $(seq 0 ${#t})
do
  grep ${t:n} dictionary.txt && break
done

이는 시작 위치에 관계없이 가장 긴 시퀀스를 검색합니다.

for len in $(seq ${#t} -1 3)
do
   for start in $(seq 0 $((${#t}-len)))
   do
       grep ${t:start:len} dictionary.txt && break 2
   done
done

요구 사항: bash와 유사한 쉘, 여기에서 사용 가능:sh.exe, grep, sed, awk, bc, cat, tac, rev, col, cut 등과 같은 많은 GNU 유틸리티의 기본 win32 포트

Question 2

일치할 때까지 머리부터 문자열을 줄이는 가능한 접근 방식은 다음과 같습니다.

#!/bin/sh
string="TMP_ABQ_SEQ_NUM"
while ! grep "$string" dictionary.txt; do 
  # remove the shortest leading string ending with "_"
  string="${string#*_}"
done

Answer

일치할 때까지 머리부터 문자열을 줄이는 가능한 접근 방식은 다음과 같습니다.

#!/bin/sh
string="TMP_ABQ_SEQ_NUM"
while ! grep "$string" dictionary.txt; do 
  # remove the shortest leading string ending with "_"
  string="${string#*_}"
done

Question 3

당신이 이것을 보는 방식을 바꿀 수 있습니까? TMP_ABQ_SEQ_NUM에서 찾는 대신 소스 파일에서 (ABQ_SEQ_NUM) dictionary.txt의 각 줄에 대한 첫 번째 필드를 찾을 수 없습니까 ?dictionary.txt

이 경우 다음이 작동해야합니다.

#!/bin/bash
for i in $(awk '{print $1}' dictionary.txt) do
    grep $i $1
done

위 스크립트에 Dictionary.txt에 있는 시퀀스를 확인하려는 파일 이름을 전달하세요. 이것이 당신이 원하는 것이 아니라면 사과드립니다.

Answer

당신이 이것을 보는 방식을 바꿀 수 있습니까? TMP_ABQ_SEQ_NUM에서 찾는 대신 소스 파일에서 (ABQ_SEQ_NUM) dictionary.txt의 각 줄에 대한 첫 번째 필드를 찾을 수 없습니까 ?dictionary.txt

이 경우 다음이 작동해야합니다.

#!/bin/bash
for i in $(awk '{print $1}' dictionary.txt) do
    grep $i $1
done

위 스크립트에 Dictionary.txt에 있는 시퀀스를 확인하려는 파일 이름을 전달하세요. 이것이 당신이 원하는 것이 아니라면 사과드립니다.

grep을 사용하는 가장 긴 공통 부분 문자열

답변1

답변2

답변3

관련 정보