Wie extrahiert man Zeilen, wenn eine der beiden Übereinstimmungszeichenfolgen übereinstimmt?

Question 1

Ich würde keine Shell-Schleife zur Textverarbeitung verwenden.

Hier können Sie einfach Folgendes tun:

cut -d _ -f 2 < country.txt

_Oder wenn die Eingabe Zeilen ohne Zeichen enthalten kann :

awk -F _ 'NF >= 2 {print $2}' < country.txt

Wenn der Ländername _Zeichen enthalten kann und Sie stattdessen den Teil der Zeile zwischen dem ersten _und dem ersten Vorkommen _rawoder _cleandanach zurückgeben möchten, können Sie Folgendes tun:

perl -ne 'print $1 if s/^[^_]*_(.*?)_(clean|raw)/' < country.txt

Oder mit GNU grep:

grep -Po '^[^_]*_\K.*?(?=_clean|_raw)' < country.txt

Bei -P(sofern grepmit PCRE-Unterstützung erstellt) ist der reguläre Ausdruck ein Perl-kompatibler. In diesen regulären Ausdrücken \Ksetzt es den Anfang der übereinstimmenden Zeichenfolge zurück und (?=...)ist ein Vorausschauoperator, d. h. es wird geprüft, ob der Rest der Zeichenfolge übereinstimmt, ...ohne dass dieser Teil im übereinstimmenden Teil enthalten ist. -ogibt grepden übereinstimmenden Teil aus, also wird hier gedruckt, was mit dem .*?obigen übereinstimmt, was das nicht gierige Äquivalent von ist .*, d. h. eine Folge von 0 oder mehr Zeichen, so kurz wie möglich, in diesem Fall nach einer Folge von 0 oder mehr Unterstrichen ( [^_]*), die am Anfang der Zeile gefunden wurden ( ), gefolgt von einem Unterstrich und vorausgesetzt, dass darauf entweder oder ^folgt ._raw_clean

Mit pcregrepkönnen Sie es auch schreiben:

pcregrep -o1 '^[^_]*_(.*?)_(clean|raw)'

Mit -o1wird der Teil gedruckt, der mit dem ersten übereinstimmt (...).

Answer

Ich würde keine Shell-Schleife zur Textverarbeitung verwenden.

Hier können Sie einfach Folgendes tun:

cut -d _ -f 2 < country.txt

_Oder wenn die Eingabe Zeilen ohne Zeichen enthalten kann :

awk -F _ 'NF >= 2 {print $2}' < country.txt

Wenn der Ländername _Zeichen enthalten kann und Sie stattdessen den Teil der Zeile zwischen dem ersten _und dem ersten Vorkommen _rawoder _cleandanach zurückgeben möchten, können Sie Folgendes tun:

perl -ne 'print $1 if s/^[^_]*_(.*?)_(clean|raw)/' < country.txt

Oder mit GNU grep:

grep -Po '^[^_]*_\K.*?(?=_clean|_raw)' < country.txt

Bei -P(sofern grepmit PCRE-Unterstützung erstellt) ist der reguläre Ausdruck ein Perl-kompatibler. In diesen regulären Ausdrücken \Ksetzt es den Anfang der übereinstimmenden Zeichenfolge zurück und (?=...)ist ein Vorausschauoperator, d. h. es wird geprüft, ob der Rest der Zeichenfolge übereinstimmt, ...ohne dass dieser Teil im übereinstimmenden Teil enthalten ist. -ogibt grepden übereinstimmenden Teil aus, also wird hier gedruckt, was mit dem .*?obigen übereinstimmt, was das nicht gierige Äquivalent von ist .*, d. h. eine Folge von 0 oder mehr Zeichen, so kurz wie möglich, in diesem Fall nach einer Folge von 0 oder mehr Unterstrichen ( [^_]*), die am Anfang der Zeile gefunden wurden ( ), gefolgt von einem Unterstrich und vorausgesetzt, dass darauf entweder oder ^folgt ._raw_clean

Mit pcregrepkönnen Sie es auch schreiben:

pcregrep -o1 '^[^_]*_(.*?)_(clean|raw)'

Mit -o1wird der Teil gedruckt, der mit dem ersten übereinstimmt (...).

Question 2

Hier ist der Weg im Awk-Stil

awk -F'_' '/clean|raw/{ print $2}'

Answer

Hier ist der Weg im Awk-Stil

awk -F'_' '/clean|raw/{ print $2}'

Wie extrahiert man Zeilen, wenn eine der beiden Übereinstimmungszeichenfolgen übereinstimmt?

Antwort1

Antwort2

verwandte Informationen