Mehrfaches Abrufen von Teilzeichenfolgen zwischen Trennzeichen aus einer Zeichenfolge ohne Schleife

Question 1

Versuchen Sie dann Folgendes:

xmlstarlet sel -t -v //Output_Path -nl data.xml

Answer

Versuchen Sie dann Folgendes:

xmlstarlet sel -t -v //Output_Path -nl data.xml

Question 2

Wenn das Grep Ihres Systems PCRE unterstützt, könnten Sie vielleicht

$ echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' | 
  grep -oP '(?<=(aaa|bbb) )\w*?(?= (aaa|bbb))'
string1
string2
string3

oder wenn Sie allgemeinere Mengen umgebender Leerzeichen verarbeiten müssen

$ echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' |
  grep -oP '(aaa|bbb)\s+\K\w*?(?=\s+(aaa|bbb))'
string1
string2
string3

Answer

Wenn das Grep Ihres Systems PCRE unterstützt, könnten Sie vielleicht

$ echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' | 
  grep -oP '(?<=(aaa|bbb) )\w*?(?= (aaa|bbb))'
string1
string2
string3

oder wenn Sie allgemeinere Mengen umgebender Leerzeichen verarbeiten müssen

$ echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' |
  grep -oP '(aaa|bbb)\s+\K\w*?(?=\s+(aaa|bbb))'
string1
string2
string3

Question 3

Wenn Sie mit etwas Strukturiertem wie diesem zufrieden sind:

string1
string2
string3

Ich würde einfach die Trennzeichen durch eine neue Zeile ersetzen. So etwas sollte Ihnen nahe kommen:

sed "s/\(aaa\)\|\(bbb\)/\n/g" test.txt

Bearbeiten

Wie @clk unten anmerkt, kann meine erste Antwort doppelte Zeilenumbrüche ergeben. Ändern Sie sie in etwas wie:

sed "s/\(\s\)\?aaa\(\s\)\?/bbb/g" test.txt | sed "s/b*//g"

ergibt für mich:

 string1 string2 string3

was auch beim Einspeisen genauso funktioniert, wie beispielsweise:

echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' | sed "s/\(\s\)\?aaa\(\s\)\?/bbb/g" | sed "s/b*//g"

Nicht sehrhübschAntwort, aber schnell und einfach und gibt Ihnen das Format, nach dem Sie fragen.

Answer

Wenn Sie mit etwas Strukturiertem wie diesem zufrieden sind:

string1
string2
string3

Ich würde einfach die Trennzeichen durch eine neue Zeile ersetzen. So etwas sollte Ihnen nahe kommen:

sed "s/\(aaa\)\|\(bbb\)/\n/g" test.txt

Bearbeiten

Wie @clk unten anmerkt, kann meine erste Antwort doppelte Zeilenumbrüche ergeben. Ändern Sie sie in etwas wie:

sed "s/\(\s\)\?aaa\(\s\)\?/bbb/g" test.txt | sed "s/b*//g"

ergibt für mich:

 string1 string2 string3

was auch beim Einspeisen genauso funktioniert, wie beispielsweise:

echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' | sed "s/\(\s\)\?aaa\(\s\)\?/bbb/g" | sed "s/b*//g"

Nicht sehrhübschAntwort, aber schnell und einfach und gibt Ihnen das Format, nach dem Sie fragen.

Question 4

Nur sed verwenden (mit -rFlag für erweiterten regulären Ausdruck)

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | sed -r 's/(aaa|bbb) ?//g'

Kehrt zurück

string1 string2 string3

Sie haben auch diese Version mit tr und grep (mit -vE):

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | tr ' ' '\n'| grep -vE '(aaa|bbb|^$)'

Kehrt zurück

string1
string2
string3

trersetzt einfach das Leerzeichen durch ein neues Zeilenzeichen. grep -vEverwendet reguläre Ausdrücke („E“) und schließt die übereinstimmenden Zeilen („v“) aus.

Die dritte Version verwendet sed (ohne Flag) und grep (wie die letzte Version):

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | sed 's/\s/\n/g' | grep -vE '(aaa|bbb|^$)'

Macht so ziemlich genau dasselbe wie Version zwei, verwendet aber sed statt tr.

Bearbeiten: Außerdem wurde es ^$in der Grep-Suchzeichenfolge hinzugefügt, um sicherzustellen, dass keine unerwünschten Zeilenumbrüche zurückgegeben werden.

Edit2: Ich sehe, Sie haben das OP geändert. Die obige Antwort bezieht sich auf die ursprüngliche Frage. Unten habe ich ein Skript erstellt, das Ihnen vielleicht weiterhelfen könnte: http://pastebin.com/uKWAGE0Y

Answer

Nur sed verwenden (mit -rFlag für erweiterten regulären Ausdruck)

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | sed -r 's/(aaa|bbb) ?//g'

Kehrt zurück

string1 string2 string3

Sie haben auch diese Version mit tr und grep (mit -vE):

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | tr ' ' '\n'| grep -vE '(aaa|bbb|^$)'

Kehrt zurück

string1
string2
string3

trersetzt einfach das Leerzeichen durch ein neues Zeilenzeichen. grep -vEverwendet reguläre Ausdrücke („E“) und schließt die übereinstimmenden Zeilen („v“) aus.

Die dritte Version verwendet sed (ohne Flag) und grep (wie die letzte Version):

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | sed 's/\s/\n/g' | grep -vE '(aaa|bbb|^$)'

Macht so ziemlich genau dasselbe wie Version zwei, verwendet aber sed statt tr.

Bearbeiten: Außerdem wurde es ^$in der Grep-Suchzeichenfolge hinzugefügt, um sicherzustellen, dass keine unerwünschten Zeilenumbrüche zurückgegeben werden.

Edit2: Ich sehe, Sie haben das OP geändert. Die obige Antwort bezieht sich auf die ursprüngliche Frage. Unten habe ich ein Skript erstellt, das Ihnen vielleicht weiterhelfen könnte: http://pastebin.com/uKWAGE0Y

Mehrfaches Abrufen von Teilzeichenfolgen zwischen Trennzeichen aus einer Zeichenfolge ohne Schleife

Antwort1

Antwort2

Antwort3

Antwort4

verwandte Informationen