
Ich bin auf eine Website gestoßen, deren Webseiten ausschließlich aus JavaScript bestehen. Diese Website hostet Videos, die ich spiegeln möchte. Wenn ich diese Website in Firefox öffne und die Seitenquelle lese, sehe ich die JavaScript-Importe in Skript-Tags. Wenn ich die Seite in Firefox untersuche, sehe ich HTML, einschließlich eines Video-Tags. Ich gehe davon aus, dass JavaScript dieses HTML generiert hat. (Ich habe kein JavaScript programmiert, daher kenne ich seine Feinheiten nicht.)
Wie erweitere ich das JavaScript, nachdem ich die Originalseite heruntergeladen habe? Ich bin auf der Suche nach einem Befehlszeilentool, das dies tut. Das resultierende HTML muss per Regex analysiert werden, um den Dateinamen der Videoquelle zu extrahieren. Meine aktuelle Idee eines Bash-Skripts, das das Video erfasst, ist folgendermaßen aufgebaut:
wget the.website.com/page/of/javascript/;
cat inThePage.html |
executeJavaScriptAndBuildHTML |
sed "the HTML and extract the video file name" |
while read aVideoFileName; do
wget $aVideoFileName;
done
Ich frage mich, ob es ein solches Tool gibt. Normalerweise wird JavaScript im Kontext eines gesamten GUI-Webbrowsers ausgeführt.
Ich habe so eine Ahnung, dass der ganze Sinn dieser Nur-JavaScript-Seite darin besteht, derartige automatische Downloads zu verhindern.