同じフォーマットとリンクを持つ他の多くの HTML からこのテキストを取得しましたが、テキストだけが異なります。テキストのこの部分、「広大な広がりの理想的な位位」を抽出したいです。基本的に、正規表現でこのテキストを検索した後、検索結果でその単語を確認する必要があります。
...<br><br>The message that an artist emphasizes in his personal work is <a href="https://mywebsite.com/zh/how-are-you.html">the ideal hypostasis of a vast expanse<img src="ru.jpg"</a> that includes the space between himself and the components of the surrounding world.<en>
そこで、この式を使って正規表現を作りましたFIRST-PART.*?SECOND-PART
探す: <a href="https://mywebsite.com/zh/how-are-you.html">.*?<img src="ru.jpg"</a>
私の正規表現の問題は、結果にはすべての行が表示されるが、テキストのみを表示する必要があることです。the ideal hypostasis of a vast expanse
答え1
以下を使用します。
- Ctrl+H
- 検索対象:
(?s)(?<=FIRST-PART).*?(?=SECOND-PART)
または
検索対象:
(?s)(?<=FIRST-PART)\K(.*?)(?=SECOND-PART)|\1
チェック マッチケース
チェック 包み込む
チェック 正規表現
あなたの場合は、彼を見つけてください:
(?s)(?<= <a href="https://mywebsite.com/zh/how-are-you.html">).*?(?=<img src="ru.jpg"</a>)