동일한 형식과 링크를 가진 다른 많은 HTML에서 가져온 이 텍스트가 있는데 텍스트만 다릅니다. 나는 텍스트에서 "광활한 창공의 이상적인 가설"이라는 부분을 추출하고 싶습니다. 기본적으로 정규식을 사용하여 이 텍스트를 찾은 후 검색 결과에서 해당 단어를 확인해야 합니다.
...<br><br>The message that an artist emphasizes in his personal work is <a href="https://mywebsite.com/zh/how-are-you.html">the ideal hypostasis of a vast expanse<img src="ru.jpg"</a> that includes the space between himself and the components of the surrounding world.<en>
그래서 저는 이 공식을 사용하여 정규식을 만들었습니다.FIRST-PART.*?SECOND-PART
찾다: <a href="https://mywebsite.com/zh/how-are-you.html">.*?<img src="ru.jpg"</a>
내 정규식의 문제는 결과가 모든 줄을 표시하지만 텍스트만 표시해야 한다는 것입니다.the ideal hypostasis of a vast expanse
답변1
다음을 사용하세요:
- Ctrl+H
- 무엇을 찾다:
(?s)(?<=FIRST-PART).*?(?=SECOND-PART)
또는
무엇을 찾다:
(?s)(?<=FIRST-PART)\K(.*?)(?=SECOND-PART)|\1
확인하다 성냥갑
확인하다 줄 바꿈
확인하다 정규식
귀하의 경우, 그를 찾으세요:
(?s)(?<= <a href="https://mywebsite.com/zh/how-are-you.html">).*?(?=<img src="ru.jpg"</a>)