結果の HTML を調べる前に JavaScript を実行するにはどうすればよいでしょうか?

2024-7-8 • tag-icon

結果の HTML を調べる前に JavaScript を実行するにはどうすればよいでしょうか?

ウェブページが JavaScript のみで構成されている Web サイトを見つけました。この Web サイトには、私がミラーリングしたいビデオがホストされています。この Web サイトを Firefox で開いてページソースを読むと、スクリプトタグに JavaScript がインポートされているのがわかります。Firefox でページを調べると、ビデオタグを含む HTML が表示されます。この HTML は JavaScript によって生成されたものだと思います (私は JavaScript をプログラムしたことがないので、その複雑さはわかりません)。

元のページをダウンロードした後、JavaScript を拡張するにはどうすればよいでしょうか。これを行うコマンドラインツールを探しています。結果の HTML は正規表現で解析され、ビデオソースファイル名が抽出されます。ビデオを取得する bash スクリプトの現在のアイデアは、次のように構成されています。

wget the.website.com/page/of/javascript/;
cat inThePage.html |
executeJavaScriptAndBuildHTML |
sed "the HTML and extract the video file name" |
while read aVideoFileName; do
    wget $aVideoFileName;
done

そのようなツールが存在するかどうかは疑問です。通常、JavaScript は GUI Web ブラウザ全体のコンテキストで実行されます。

JavaScript のみのページの目的は、この種の自動ダウンロードを防ぐことにあるのではないかと思います。

関連情報