Получение подстрок между разделителями несколько раз из одной строки без зацикливания

Question 1

Тогда попробуйте это:

xmlstarlet sel -t -v //Output_Path -nl data.xml

Answer

Тогда попробуйте это:

xmlstarlet sel -t -v //Output_Path -nl data.xml

Question 2

Если grep вашей системы поддерживает PCRE, вы можете сделать следующее:

$ echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' | 
  grep -oP '(?<=(aaa|bbb) )\w*?(?= (aaa|bbb))'
string1
string2
string3

или если вам нужно обработать более общие объемы окружающего пробела

$ echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' |
  grep -oP '(aaa|bbb)\s+\K\w*?(?=\s+(aaa|bbb))'
string1
string2
string3

Answer

Если grep вашей системы поддерживает PCRE, вы можете сделать следующее:

$ echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' | 
  grep -oP '(?<=(aaa|bbb) )\w*?(?= (aaa|bbb))'
string1
string2
string3

или если вам нужно обработать более общие объемы окружающего пробела

$ echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' |
  grep -oP '(aaa|bbb)\s+\K\w*?(?=\s+(aaa|bbb))'
string1
string2
string3

Question 3

Если вас устроит что-то структурированное вроде:

string1
string2
string3

Я бы просто заменил ваши разделители на новую строку. Что-то вроде этого должно приблизить вас к этому:

sed "s/\(aaa\)\|\(bbb\)/\n/g" test.txt

Редактировать

Как указал @clk ниже, мой первый ответ может дать двойные переводы строк. Изменим на что-то вроде:

sed "s/\(\s\)\?aaa\(\s\)\?/bbb/g" test.txt | sed "s/b*//g"

для меня выход:

 string1 string2 string3

который также работает так же при передаче по каналу, например:

echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' | sed "s/\(\s\)\?aaa\(\s\)\?/bbb/g" | sed "s/b*//g"

Не оченьсимпатичныйответ, но быстрый и грубый, и дает вам тот формат, который вы запрашиваете.

Answer

Если вас устроит что-то структурированное вроде:

string1
string2
string3

Я бы просто заменил ваши разделители на новую строку. Что-то вроде этого должно приблизить вас к этому:

sed "s/\(aaa\)\|\(bbb\)/\n/g" test.txt

Редактировать

Как указал @clk ниже, мой первый ответ может дать двойные переводы строк. Изменим на что-то вроде:

sed "s/\(\s\)\?aaa\(\s\)\?/bbb/g" test.txt | sed "s/b*//g"

для меня выход:

 string1 string2 string3

который также работает так же при передаче по каналу, например:

echo 'aaa string1 bbb aaa string2 bbb aaa string3 bbb' | sed "s/\(\s\)\?aaa\(\s\)\?/bbb/g" | sed "s/b*//g"

Не оченьсимпатичныйответ, но быстрый и грубый, и дает вам тот формат, который вы запрашиваете.

Question 4

Используя только sed (с -rфлагом для расширенного регулярного выражения)

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | sed -r 's/(aaa|bbb) ?//g'

Возвраты

string1 string2 string3

У вас также есть эта версия, использующая tr и grep (с -vE):

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | tr ' ' '\n'| grep -vE '(aaa|bbb|^$)'

Возвраты

string1
string2
string3

trпросто заменяет символ пробела на новую строку. grep -vEиспользует регулярное выражение ("E") и исключает совпадающие строки ("v").

Третья версия использует sed (без флага) и grep (то же, что и предыдущая версия):

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | sed 's/\s/\n/g' | grep -vE '(aaa|bbb|^$)'

Делает практически то же самое, что и версия 2, используя sed вместо tr.

Редактировать: Также добавил ^$в строку поиска grep, чтобы убедиться, что она не возвращает нежелательные символы новой строки.

Edit2: Я вижу, что вы сменили OP. Выше ответ на исходный вопрос. Ниже я сделал скрипт, который может вам помочь: http://pastebin.com/uKWAGE0Y

Answer

Используя только sed (с -rфлагом для расширенного регулярного выражения)

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | sed -r 's/(aaa|bbb) ?//g'

Возвраты

string1 string2 string3

У вас также есть эта версия, использующая tr и grep (с -vE):

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | tr ' ' '\n'| grep -vE '(aaa|bbb|^$)'

Возвраты

string1
string2
string3

trпросто заменяет символ пробела на новую строку. grep -vEиспользует регулярное выражение ("E") и исключает совпадающие строки ("v").

Третья версия использует sed (без флага) и grep (то же, что и предыдущая версия):

echo "aaa string1 bbb aaa string2 bbb aaa string3 bbb" | sed 's/\s/\n/g' | grep -vE '(aaa|bbb|^$)'

Делает практически то же самое, что и версия 2, используя sed вместо tr.

Редактировать: Также добавил ^$в строку поиска grep, чтобы убедиться, что она не возвращает нежелательные символы новой строки.

Edit2: Я вижу, что вы сменили OP. Выше ответ на исходный вопрос. Ниже я сделал скрипт, который может вам помочь: http://pastebin.com/uKWAGE0Y

Связанный контент