Como extrair linhas se alguma das duas strings correspondentes corresponder?

Question 1

Eu não usaria um shell loop para processar texto.

Aqui, você pode simplesmente fazer:

cut -d _ -f 2 < country.txt

Ou se a entrada puder conter linhas sem _caracteres:

awk -F _ 'NF >= 2 {print $2}' < country.txt

Se o nome do país puder conter _caracteres e você quiser retornar a parte da linha entre a primeira _e a primeira ocorrência _rawou _cleandepois disso, você poderia fazer:

perl -ne 'print $1 if s/^[^_]*_(.*?)_(clean|raw)/' < country.txt

Ou com GNU grep:

grep -Po '^[^_]*_\K.*?(?=_clean|_raw)' < country.txt

Com -P(desde que greptenha sido construído com suporte PCRE), o regexp é compatível com Perl. Nessas regexps, \Kredefine o início da string correspondente e (?=...)é um operador lookahead, ou seja, verifica se o restante da string corresponde ...sem que essa parte seja incluída na parte correspondente. -ogera grepa saída da parte correspondente, então aqui ele imprime o que corresponde ao .*?acima, que é o equivalente não ganancioso de .*, que é uma sequência de 0 ou mais caracteres, o mais curto possível, neste caso seguindo uma sequência de 0 ou mais sublinhados ( [^_]*) encontrado no início da linha ( ^) seguido por um sublinhado e assumindo que seja seguido por _rawou _clean.

Com pcregrep, você também pode escrever:

pcregrep -o1 '^[^_]*_(.*?)_(clean|raw)'

Com -o1, ele imprime a parte correspondente ao primeiro (...).

Answer

Eu não usaria um shell loop para processar texto.

Aqui, você pode simplesmente fazer:

cut -d _ -f 2 < country.txt

Ou se a entrada puder conter linhas sem _caracteres:

awk -F _ 'NF >= 2 {print $2}' < country.txt

Se o nome do país puder conter _caracteres e você quiser retornar a parte da linha entre a primeira _e a primeira ocorrência _rawou _cleandepois disso, você poderia fazer:

perl -ne 'print $1 if s/^[^_]*_(.*?)_(clean|raw)/' < country.txt

Ou com GNU grep:

grep -Po '^[^_]*_\K.*?(?=_clean|_raw)' < country.txt

Com -P(desde que greptenha sido construído com suporte PCRE), o regexp é compatível com Perl. Nessas regexps, \Kredefine o início da string correspondente e (?=...)é um operador lookahead, ou seja, verifica se o restante da string corresponde ...sem que essa parte seja incluída na parte correspondente. -ogera grepa saída da parte correspondente, então aqui ele imprime o que corresponde ao .*?acima, que é o equivalente não ganancioso de .*, que é uma sequência de 0 ou mais caracteres, o mais curto possível, neste caso seguindo uma sequência de 0 ou mais sublinhados ( [^_]*) encontrado no início da linha ( ^) seguido por um sublinhado e assumindo que seja seguido por _rawou _clean.

Com pcregrep, você também pode escrever:

pcregrep -o1 '^[^_]*_(.*?)_(clean|raw)'

Com -o1, ele imprime a parte correspondente ao primeiro (...).

Question 2

Aqui está o caminho no estilo awk

awk -F'_' '/clean|raw/{ print $2}'

Answer

Aqui está o caminho no estilo awk

awk -F'_' '/clean|raw/{ print $2}'

Como extrair linhas se alguma das duas strings correspondentes corresponder?

Responder1

Responder2

informação relacionada