регулярное выражение для сопоставления всего, кроме подстрок, начинающихся с hashkey

Question

Не обращайте внимания на сопоставление всего, кроме подстрок, начинающихся с '@' или '#'. Я просто сделал наоборот и использовал re.sub в python, чтобы удалить их из строки:

>>> import re
>>> text = 'Hi shah rukh. Who is your co-actor in the upcoming movie? @iamsrk #lovefrommalaysia #askSRK'
>>> text = re.sub(r'([\#\@].*?)(?=([\r\n ]|$))', '', text).strip()
>>> print text
Hi shah rukh. Who is your co-actor in the upcoming movie?

Краткое объяснение:

Соответствующая группа №1 объединяет ([\#\@].*?)символы # или @ вместе с минимальным количеством следующих за ними символов (нежадный алгоритм).
Положительный просмотр вперед (?=([\r\n ]|$))пытается сопоставить возврат каретки, новую строку, пробел или конец строки, не включая их в результат.

Не знаю, насколько это элегантное решение, но для меня оно работает. Попробуйте.regexr.com

Answer 1

Не обращайте внимания на сопоставление всего, кроме подстрок, начинающихся с '@' или '#'. Я просто сделал наоборот и использовал re.sub в python, чтобы удалить их из строки:

>>> import re
>>> text = 'Hi shah rukh. Who is your co-actor in the upcoming movie? @iamsrk #lovefrommalaysia #askSRK'
>>> text = re.sub(r'([\#\@].*?)(?=([\r\n ]|$))', '', text).strip()
>>> print text
Hi shah rukh. Who is your co-actor in the upcoming movie?

Краткое объяснение:

Соответствующая группа №1 объединяет ([\#\@].*?)символы # или @ вместе с минимальным количеством следующих за ними символов (нежадный алгоритм).
Положительный просмотр вперед (?=([\r\n ]|$))пытается сопоставить возврат каретки, новую строку, пробел или конец строки, не включая их в результат.

Не знаю, насколько это элегантное решение, но для меня оно работает. Попробуйте.regexr.com

регулярное выражение для сопоставления всего, кроме подстрок, начинающихся с hashkey

решение1

Связанный контент