У меня есть этот текст, из многих других html с тем же форматом и ссылками, только текст другой. Я хочу извлечь эту часть текста: "идеальная ипостась обширного пространства". В принципе, после того, как я найду этот текст с помощью regex, мне нужно увидеть эти слова в результатах поиска.
...<br><br>The message that an artist emphasizes in his personal work is <a href="https://mywebsite.com/zh/how-are-you.html">the ideal hypostasis of a vast expanse<img src="ru.jpg"</a> that includes the space between himself and the components of the surrounding world.<en>
Итак, я создал регулярное выражение с этой формулойFIRST-PART.*?SECOND-PART
НАХОДИТЬ: <a href="https://mywebsite.com/zh/how-are-you.html">.*?<img src="ru.jpg"</a>
Проблема моего регулярного выражения в том, что в результате оно показывает мне все строки, а мне нужно показать только текст:the ideal hypostasis of a vast expanse
решение1
Используйте следующее:
- Ctrl+H
- Найти то, что:
(?s)(?<=FIRST-PART).*?(?=SECOND-PART)
ИЛИ
Найти то, что:
(?s)(?<=FIRST-PART)\K(.*?)(?=SECOND-PART)|\1
ПРОВЕРЯТЬ Учитывать регистр
ПРОВЕРЯТЬ Обернуть вокруг
ПРОВЕРЯТЬ Регулярное выражение
В вашем случае НАЙДИТЕ ЕГО:
(?s)(?<= <a href="https://mywebsite.com/zh/how-are-you.html">).*?(?=<img src="ru.jpg"</a>)