¿Cómo extraer líneas si alguna de las dos cadenas coincidentes?

Question 1

No usaría un bucle de shell para procesar texto.

Aquí, puedes simplemente hacer:

cut -d _ -f 2 < country.txt

O si la entrada puede contener líneas sin _caracteres:

awk -F _ 'NF >= 2 {print $2}' < country.txt

Si el nombre del país puede contener _caracteres y, en cambio, desea devolver la parte de la línea entre la primera _y la primera aparición de _rawo _cleandespués de eso, puede hacer:

perl -ne 'print $1 if s/^[^_]*_(.*?)_(clean|raw)/' < country.txt

O con GNU grep:

grep -Po '^[^_]*_\K.*?(?=_clean|_raw)' < country.txt

Con -P(siempre que grepse haya creado con soporte PCRE), la expresión regular es compatible con Perl. En esas expresiones regulares, \Krestablece el inicio de la cadena coincidente y (?=...)es un operador de anticipación, es decir, busca si el resto de la cadena coincide ...sin que esa parte se incluya en la parte coincidente. -ogenera grepla parte coincidente, por lo que aquí imprime lo que coincide con lo .*?anterior, que es el equivalente no codicioso de .*, es decir, una secuencia de 0 o más caracteres, lo más corta posible, en este caso siguiendo una secuencia de 0 o más guiones bajos ( [^_]*) que se encuentra al inicio de la línea ( ^) seguido de un guión bajo y suponiendo que vaya seguido de _rawo _clean.

Con pcregrep, también puedes escribirlo:

pcregrep -o1 '^[^_]*_(.*?)_(clean|raw)'

Con -o1, imprime la porción que coincide con la primera (...).

Answer

No usaría un bucle de shell para procesar texto.

Aquí, puedes simplemente hacer:

cut -d _ -f 2 < country.txt

O si la entrada puede contener líneas sin _caracteres:

awk -F _ 'NF >= 2 {print $2}' < country.txt

Si el nombre del país puede contener _caracteres y, en cambio, desea devolver la parte de la línea entre la primera _y la primera aparición de _rawo _cleandespués de eso, puede hacer:

perl -ne 'print $1 if s/^[^_]*_(.*?)_(clean|raw)/' < country.txt

O con GNU grep:

grep -Po '^[^_]*_\K.*?(?=_clean|_raw)' < country.txt

Con -P(siempre que grepse haya creado con soporte PCRE), la expresión regular es compatible con Perl. En esas expresiones regulares, \Krestablece el inicio de la cadena coincidente y (?=...)es un operador de anticipación, es decir, busca si el resto de la cadena coincide ...sin que esa parte se incluya en la parte coincidente. -ogenera grepla parte coincidente, por lo que aquí imprime lo que coincide con lo .*?anterior, que es el equivalente no codicioso de .*, es decir, una secuencia de 0 o más caracteres, lo más corta posible, en este caso siguiendo una secuencia de 0 o más guiones bajos ( [^_]*) que se encuentra al inicio de la línea ( ^) seguido de un guión bajo y suponiendo que vaya seguido de _rawo _clean.

Con pcregrep, también puedes escribirlo:

pcregrep -o1 '^[^_]*_(.*?)_(clean|raw)'

Con -o1, imprime la porción que coincide con la primera (...).

Question 2

Aquí está el camino en estilo awk.

awk -F'_' '/clean|raw/{ print $2}'

Answer

Aquí está el camino en estilo awk.

awk -F'_' '/clean|raw/{ print $2}'

¿Cómo extraer líneas si alguna de las dos cadenas coincidentes?

Respuesta1

Respuesta2

información relacionada