
Ich habe eine Liste von URLs in einer TXT-Datei. Jede dieser URLs verweist auf eine Seite mit einer anderen Liste von URLs. Mit welchem WGET-Befehl kann ich die URLs von den Seiten abrufen, die von den URLs in meiner TXT-Datei aus verlinkt wurden?
HINWEIS: Ich möchte keine Dateien herunterladen, sondern nur die Liste der URLs in eine TXT-Datei ausgeben.
Antwort1
(ungetestet):
wget -r -l 1 -i file
wget
Der Befehl hat viele Optionen ... In diesem Fall:
-r
steht für rekursiv-l 1
bedeutet nur eine Rekursionsebene (versuchen Sie es mit 2, wenn eine nicht ausreicht)-i file
bedeutet, dass die Datei eine Liste von Startpunkt-URLs enthält