Extraiga valores de HTML mediante un analizador HTML

Extraiga valores de HTML mediante un analizador HTML

Inicialmente pregunté acerca de una forma de usar grep/ awkdirectamente desde un archivo HTML. Recibí algunos comentarios, pero veo que la gente no tenía todo el HTML y, por lo tanto, las soluciones sugeridas fallaron.

Algunos han mencionado que el análisis de HTML sería una opción mucho mejor. Trabajo en Raspberry Pi con Linux/Debian Wheezy estándar.

El HTML mencionado se encuentra aquí, HTML simple...pero supongo que es importante ver el archivo completo para poder ayudar:

https://www.dropbox.com/s/9jdgzen2hwjxhjp/main.htm

Entonces lo que se requiere es:

  • Extraiga los dos valores, Pplus y Pminus (18,0000 y 0,00000) y proporciónelos, además de proporcionar la SUMA.
  • Ambos valores provienen de un contador inteligente (medidor de energía) que proporciona la energía generada P- y la energía/potencia extraída de la red P+.
  • P- en caso de que el sol y la planta solar funcionen, entonces 18W es por la noche, 0.0000 significa que no hay generación porque no hay sol, solo para brindarle información general.

Intenté actualizar y pedir ayuda en el hilo original, pero parece que nadie lo ha vuelto a ver ya que no ha habido ningún comentario nuevo en los últimos días. Este es mi intento ahora de llevar esto a los expertos aquí.

Respuesta1

Mirando este archivo HTML de muestra:

<DIV ID="idButtonDiv" STYLE="top:143px; left:0px;" ALIGN="CENTER">
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0"><TR><TD ID="idButtonTd">
18.000

</TD></TR></TABLE>
</DIV>

No parece que esto sea fácilmente analizable.

información relacionada