Subcadena común más larga usando grep

Question 1

Esto intentaría hacer coincidir desde el principio:

t=TMP_ABC_SEQ_NUM
for n in $(seq 0 ${#t})
do
  grep ${t:n} dictionary.txt && break
done

Esto busca la secuencia más larga, sin importar dónde comience:

for len in $(seq ${#t} -1 3)
do
   for start in $(seq 0 $((${#t}-len)))
   do
       grep ${t:start:len} dictionary.txt && break 2
   done
done

requisito: Un shell tipo bash, disponible aquí:Puertos nativos win32 de muchas utilidades GNU, como sh.exe, grep, sed, awk, bc, cat, tac, rev, col, cut, ...

Answer

Esto intentaría hacer coincidir desde el principio:

t=TMP_ABC_SEQ_NUM
for n in $(seq 0 ${#t})
do
  grep ${t:n} dictionary.txt && break
done

Esto busca la secuencia más larga, sin importar dónde comience:

for len in $(seq ${#t} -1 3)
do
   for start in $(seq 0 $((${#t}-len)))
   do
       grep ${t:start:len} dictionary.txt && break 2
   done
done

requisito: Un shell tipo bash, disponible aquí:Puertos nativos win32 de muchas utilidades GNU, como sh.exe, grep, sed, awk, bc, cat, tac, rev, col, cut, ...

Question 2

Un posible enfoque, acortar la cuerda desde la cabeza hasta que coincida:

#!/bin/sh
string="TMP_ABQ_SEQ_NUM"
while ! grep "$string" dictionary.txt; do 
  # remove the shortest leading string ending with "_"
  string="${string#*_}"
done

Answer

Un posible enfoque, acortar la cuerda desde la cabeza hasta que coincida:

#!/bin/sh
string="TMP_ABQ_SEQ_NUM"
while ! grep "$string" dictionary.txt; do 
  # remove the shortest leading string ending with "_"
  string="${string#*_}"
done

Question 3

¿Podrías revertir la forma en que estás viendo esto? En lugar de buscar TMP_ABQ_SEQ_NUMen dictionary.txt, ¿no podría buscar el primer campo para cada línea en dictionary.txt(ABQ_SEQ_NUM) en el archivo fuente?

Si este es el caso, lo siguiente debería funcionar

#!/bin/bash
for i in $(awk '{print $1}' dictionary.txt) do
    grep $i $1
done

Pase al script anterior el nombre del archivo que desea verificar para ver las secuencias presentes en diccionario.txt. Disculpas si esto no es lo que querías.

Answer

¿Podrías revertir la forma en que estás viendo esto? En lugar de buscar TMP_ABQ_SEQ_NUMen dictionary.txt, ¿no podría buscar el primer campo para cada línea en dictionary.txt(ABQ_SEQ_NUM) en el archivo fuente?

Si este es el caso, lo siguiente debería funcionar

#!/bin/bash
for i in $(awk '{print $1}' dictionary.txt) do
    grep $i $1
done

Pase al script anterior el nombre del archivo que desea verificar para ver las secuencias presentes en diccionario.txt. Disculpas si esto no es lo que querías.

Subcadena común más larga usando grep

Respuesta1

Respuesta2

Respuesta3

información relacionada