Wie greift man mit den Befehlen curl und grep auf den Kopfbereich einer Website zu?

Question 1

Es ist etwas komplexer als das, was Sie versuchen.

Erstens gibt es einige Syntaxprobleme mit Ihrem Befehl. Er curl www.hackthissite.org: grep "<head> > ~/data/public/myfirstname\ mylastname/head.txtsollte lauten:

curl www.hackthissite.org | grep "<head>" > ~/data/public/myfirstname\ mylastname/head.txt

Aber trotzdem würde es nicht das gewünschte Ergebnis erzielen, da Sie nur das Kopf-Öffnungs-Tag erfassen, nicht aber das, was zwischen diesem und dem Schließ-Tag steht.

Mir ist Folgendes eingefallen:

curl www.hackthissite.org > TEMPORARYFILE.txt; grep -A $(($(grep -n "</head>" TEMPORARYFILE.txt | cut -d: -f1) - $(grep -n "<head>" TEMPORARYFILE.txt | cut -d: -f1))) "<head>" TEMPORARYFILE.txt > ~/data/public/myfirstname\ mylastname/head.txt; rm TEMPORARYFILE.txt

Also, in Teilen:

grep -n "</head>" TEMPORARYFILE.txt | cut -d: -f1

Dadurch wird die Nummer der Zeile abgerufen, in der sich das schließende Tag befindet. Dasselbe gilt für grep -n "<head>" TEMPORARYFILE.txt | cut -d: -f1, jedoch für das öffnende Tag.

Dann haben wir $(($(grep -n "</head>" TEMPORARYFILE.txt | cut -d: -f1) - $(grep -n "<head>" TEMPORARYFILE.txt | cut -d: -f1))), das berechnen soll, wie viele Zeilen sich zwischen dem öffnenden und dem schließenden Tag befinden.

Dies wird mit der -AOption verwendet grep, die uns die Kontrolle darüber gibt, wie viele Zeilen nach der Übereinstimmung wir drucken möchten. Es wird also nach dem öffnenden Head-Tag gesucht und alle Zeilen zwischen diesem und dem schließenden Tag gedruckt.

Answer