HTML 파서를 통해 HTML에서 값 추출

HTML 파서를 통해 HTML에서 값 추출

처음에 HTML 파일에서 grep/를 직접 사용하는 방법에 대해 문의했습니다 . awk몇 가지 피드백을 받았지만 사람들이 전체 HTML을 가지고 있지 않아 제안된 솔루션이 실패했다는 것을 알았습니다.

일부에서는 HTML 구문 분석이 훨씬 더 나은 옵션이 될 것이라고 언급했습니다. 저는 표준 Linux/Debian Wheezy를 사용하여 Raspberry Pi를 작업합니다.

언급된 HTML은 여기에서 찾을 수 있습니다. 간단한 HTML입니다. 하지만 도움을 받으려면 전체 파일을 보는 것이 중요할 것 같습니다.

https://www.dropbox.com/s/9jdgzen2hwjxhjp/main.htm

따라서 필요한 것은 다음과 같습니다.

  • 두 값 Pplus 및 Pminus(18.0000 및 0.00000)를 추출하여 제공하고 SUM도 제공합니다.
  • 두 값 모두 생성된 에너지 P-와 네트워크 P+에서 가져온 에너지/전력을 제공하는 스마트 미터(에너지 측정기)에서 나옵니다.
  • P- 태양 및 태양광 발전소가 작동하는 경우 18W는 밤에 해당합니다. 0.0000은 태양이 없으므로 생성이 없음을 의미합니다. 단지 몇 가지 배경 정보를 제공하기 위한 것입니다.

원래 스레드에서 업데이트하고 지원을 요청하려고 했지만 지난 며칠 동안 새로운 피드백이 없었기 때문에 아무도 다시 본 적이 없는 것 같습니다. 이것은 이제 이것을 전문가에게 다시 가져오려는 나의 시도입니다.

답변1

이 샘플 HTML 파일을 보면 다음과 같습니다.

<DIV ID="idButtonDiv" STYLE="top:143px; left:0px;" ALIGN="CENTER">
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0"><TR><TD ID="idButtonTd">
18.000

</TD></TR></TABLE>
</DIV>

이는 쉽게 구문 분석할 수 있는 것으로 보이지 않습니다.

관련 정보