Extrahieren von Werten aus HTML über HTML-Parser

Extrahieren von Werten aus HTML über HTML-Parser

grepIch habe zunächst nach einer Möglichkeit gefragt , / direkt aus einer HTML-Datei zu verwenden awk. Ich habe einige Rückmeldungen erhalten, sehe aber, dass die Leute nicht über das gesamte HTML verfügten und die vorgeschlagenen Lösungen daher fehlschlugen.

Einige haben erwähnt, dass HTML-Parsing eine viel bessere Option wäre. Ich arbeite auf Raspberry Pi mit Standard-Linux/Debian Wheezy.

Das erwähnte HTML finden Sie hier, einfaches HTML … aber ich denke, es ist wichtig, die gesamte Datei zu sehen, um helfen zu können:

https://www.dropbox.com/s/9jdgzen2hwjxhjp/main.htm

Was also erforderlich ist, ist:

  • Extrahieren Sie die beiden Werte Pplus und Pminus (18,0000 und 0,00000) und geben Sie diese sowie die Summe an.
  • Beide Werte stammen von einem Smart Meter (Energiezähler), der die erzeugte Energie P- und die aus dem Netz bezogene Energie/Leistung P+ angibt.
  • P- bei Sonne und funktionierendem Solarkraftwerk, also 18 W in der Nacht, 0,0000 bedeutet keine Stromerzeugung, da keine Sonne, nur um Ihnen einige Hintergrundinformationen zu geben.

Ich habe versucht, im ursprünglichen Thread ein Update durchzuführen und um Unterstützung zu bitten, aber anscheinend hat es niemand mehr gesehen, da es in den letzten Tagen kein neues Feedback gab. Dies ist jetzt mein Versuch, dies hier wieder an die Experten weiterzuleiten.

Antwort1

Sehen Sie sich diese Beispiel-HTML-Datei an:

<DIV ID="idButtonDiv" STYLE="top:143px; left:0px;" ALIGN="CENTER">
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0"><TR><TD ID="idButtonTd">
18.000

</TD></TR></TABLE>
</DIV>

Es scheint nicht so, als ob dies leicht zu analysieren wäre.

verwandte Informationen