
ウェブページが JavaScript のみで構成されている Web サイトを見つけました。この Web サイトには、私がミラーリングしたいビデオがホストされています。この Web サイトを Firefox で開いてページ ソースを読むと、スクリプト タグに JavaScript がインポートされているのがわかります。Firefox でページを調べると、ビデオ タグを含む HTML が表示されます。この HTML は JavaScript によって生成されたものだと思います (私は JavaScript をプログラムしたことがないので、その複雑さはわかりません)。
元のページをダウンロードした後、JavaScript を拡張するにはどうすればよいでしょうか。これを行うコマンドライン ツールを探しています。結果の HTML は正規表現で解析され、ビデオ ソース ファイル名が抽出されます。ビデオを取得する bash スクリプトの現在のアイデアは、次のように構成されています。
wget the.website.com/page/of/javascript/;
cat inThePage.html |
executeJavaScriptAndBuildHTML |
sed "the HTML and extract the video file name" |
while read aVideoFileName; do
wget $aVideoFileName;
done
そのようなツールが存在するかどうかは疑問です。通常、JavaScript は GUI Web ブラウザ全体のコンテキストで実行されます。
JavaScript のみのページの目的は、この種の自動ダウンロードを防ぐことにあるのではないかと思います。