Ausgewähltes Tag aus HTML-Datei abrufen

Question 1

grepSie können dafür und seinen einzigen passenden Parameter ( ) verwenden -o, zB:

$ grep -o "<[^>]*>" <(curl -s http://example.com/)

Dadurch werden alle HTML-Tags einschließlich der Reihenfolge gedruckt.

<script>Um nur Tags einzuschließen , versuchen Sie (ändern Sie es index.htmlmit Ihrer Datei):

$ grep -Eo "<script.*(</script>|>)" index.html

Um nur die Dateinamen (aus srcdem Attribut) zu erhalten, können Sie durch Hinzufügen eines weiteren erweitern grep, z. B.:

$ grep -Eo "<script.*(</script>|>)" index.html | grep -o '"[^"]*"' | tr -d '"'

Die obige Syntax hilft Ihnen bei vielen verschiedenen Variationen von HTML-Code nicht weiter. Für komplexere LösungenVerwenden von regulären Ausdrücken zum Parsen von HTMLwird im Allgemeinen nicht empfohlen, daher sollten Sie geeignete Tools verwenden (Sprache Ihrer Wahl oder schauen Sie sich diese anShell-Werkzeuge).

Answer

grepSie können dafür und seinen einzigen passenden Parameter ( ) verwenden -o, zB:

$ grep -o "<[^>]*>" <(curl -s http://example.com/)

Dadurch werden alle HTML-Tags einschließlich der Reihenfolge gedruckt.

<script>Um nur Tags einzuschließen , versuchen Sie (ändern Sie es index.htmlmit Ihrer Datei):

$ grep -Eo "<script.*(</script>|>)" index.html

Um nur die Dateinamen (aus srcdem Attribut) zu erhalten, können Sie durch Hinzufügen eines weiteren erweitern grep, z. B.:

$ grep -Eo "<script.*(</script>|>)" index.html | grep -o '"[^"]*"' | tr -d '"'

Die obige Syntax hilft Ihnen bei vielen verschiedenen Variationen von HTML-Code nicht weiter. Für komplexere LösungenVerwenden von regulären Ausdrücken zum Parsen von HTMLwird im Allgemeinen nicht empfohlen, daher sollten Sie geeignete Tools verwenden (Sprache Ihrer Wahl oder schauen Sie sich diese anShell-Werkzeuge).

Question 2

Ich weiß, dass Sie bereits eine Antwort akzeptiert haben, aber ich möchte auch hinzufügen, dass Sie sich Folgendes ansehen können:xpath.

Es ist speziell für Daten im XML-Stil gedacht.

In Ihrem Fall wäre der XPath hierfür

//script

Hierist auch ein weiteres Beispiel für jemanden, der XPath zum Parsen von HTML verwendet

Answer

Ich weiß, dass Sie bereits eine Antwort akzeptiert haben, aber ich möchte auch hinzufügen, dass Sie sich Folgendes ansehen können:xpath.

Es ist speziell für Daten im XML-Stil gedacht.

In Ihrem Fall wäre der XPath hierfür

//script

Hierist auch ein weiteres Beispiel für jemanden, der XPath zum Parsen von HTML verwendet

Ausgewähltes Tag aus HTML-Datei abrufen

Antwort1

Antwort2

verwandte Informationen