透過 HTML 解析器從 HTML 中提取值

透過 HTML 解析器從 HTML 中提取值

我最初詢問了一種直接從 HTML 文件使用grep/的方法。awk我收到了一些回饋,但我發現人們沒有完整的 HTML,因此建議的解決方案失敗了。

有些人提到 HTML 解析會是更好的選擇。我在使用標準 Linux/Debian Wheezy 的 Raspberry Pi 上工作。

提到的 HTML 可以在這裡找到,簡單的 HTML...但我想查看整個文件能夠提供幫助很重要:

https://www.dropbox.com/s/9jdgzen2hwjxhjp/main.htm

所以需要做的是:

  • 提取兩個值 Pplus 和 Pminus(18.0000 和 0.00000)並提供它們,並提供 SUM。
  • 這兩個值均來自智慧電錶(電能表),此智慧電錶提供產生的能量 P- 和從網路獲得的能量/功率 P+。
  • P-在有太陽和太陽能發電廠工作的情況下,所以18W是在晚上,0.0000意味著沒有太陽,所以不發電,只是給你一些背景資訊。

我嘗試在原始線程中更新並請求支持,但似乎沒有人再看到它,因為過去幾天沒有任何新的反饋。我現在嘗試將這個問題帶回給這裡的專家。

答案1

查看這個範例 HTML 檔案:

<DIV ID="idButtonDiv" STYLE="top:143px; left:0px;" ALIGN="CENTER">
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0"><TR><TD ID="idButtonTd">
18.000

</TD></TR></TABLE>
</DIV>

看起來這並不容易解析。

相關內容