Extraia valores de HTML via analisador de HTML

Extraia valores de HTML via analisador de HTML

Inicialmente perguntei sobre uma maneira de usar grep/ awkdiretamente de um arquivo HTML. Recebi alguns comentários, mas vejo que as pessoas não tinham o HTML completo e por isso as soluções sugeridas falharam.

Alguns mencionaram que a análise de HTML seria uma opção muito melhor. Eu trabalho no Raspberry Pi com Linux/Debian Wheezy padrão.

O HTML mencionado encontra-se aqui, HTML simples...mas acho que é importante ver o arquivo completo para poder ajudar:

https://www.dropbox.com/s/9jdgzen2hwjxhjp/main.htm

Então o que é necessário é:

  • Extraia os dois valores, Pplus e Pminus (18,0000 e 0,00000) e forneça-os, além de fornecer a SOMA.
  • Ambos os valores provêm de um medidor inteligente (medidor de energia) que fornece a energia gerada P- e a energia/potência retirada da rede P+.
  • P- no caso de sol e usina solar funcionando, então 18W é à noite, 0,0000 significa sem geração como sem sol, apenas para lhe dar algumas informações básicas.

Tentei atualizar e pedir suporte no tópico original, mas parece que ninguém o viu novamente, pois não houve nenhum feedback novo nos últimos dias. Esta é minha tentativa agora de trazer isso de volta aos especialistas aqui.

Responder1

Olhando para este exemplo de arquivo HTML:

<DIV ID="idButtonDiv" STYLE="top:143px; left:0px;" ALIGN="CENTER">
<TABLE CELLSPACING="0" CELLPADDING="0" BORDER="0"><TR><TD ID="idButtonTd">
18.000

</TD></TR></TABLE>
</DIV>

Não parece que isso seria facilmente analisável.

informação relacionada