
У меня есть файл с кучей длинных строк. Я хотел бы захватить каждую группу между двумя шаблонами и вывести их в новый файл, по одному совпадению на строку. Я мог бы сделать это с помощью Python, но я бы предпочел использовать только инструменты командной строки для этой задачи. Если шаблона конца нет, я бы хотел захватить все до конца строки.
Что-то вроде:
input:
xxSTART relevanttext xxEND something else xxSTART even more relevant
output:
relevanttext
even more relevant
решение1
ЕСЛИ GNU grep является опцией, вы можете передать -P
флаг (регулярное выражение, совместимое с Perl) и использовать утверждения просмотра вперед, утверждения просмотра назад и нежадные совпадения, чтобы извлечь то, что вам нужно.
echo 'xxSTART relevanttext xxEND something else xxSTART even more relevant' |\
grep -oP '(?<=START).*?(?=xxEND|$)'
relevanttext
even more relevant
Или, как предлагает Стефан Шазелас, используйте изящную\Квместо утверждения о взгляде назад
echo 'xxSTART relevanttext xxEND something else xxSTART even more relevant' |\
grep -oP 'START\K.*?(?=xxEND|$)'