
Encontrei um site cujas páginas consistem exclusivamente em JavaScript. Este site hospeda vídeos que eu gostaria de espelhar. Quando abro este site no Firefox e leio o código-fonte da página, vejo as importações de JavaScript nas tags de script. Quando inspeciono a página no Firefox, vejo HTML, incluindo uma tag de vídeo. Presumo que o JavaScript gerou esse HTML. (Eu não programei JavaScript, então não conheço seus meandros.)
Como faço para expandir o JavaScript depois de baixar a página original? Estou atrás de uma ferramenta de linha de comando que faça isso. O HTML resultante deve ser analisado por regex para extrair o nome do arquivo de origem do vídeo. Minha ideia atual de um script bash que captura o vídeo está estruturada assim:
wget the.website.com/page/of/javascript/;
cat inThePage.html |
executeJavaScriptAndBuildHTML |
sed "the HTML and extract the video file name" |
while read aVideoFileName; do
wget $aVideoFileName;
done
Eu me pergunto se tal ferramenta existe; geralmente o JavaScript é executado no contexto de um navegador GUI inteiro.
Tenho a impressão de que o objetivo da página somente JavaScript é evitar esse tipo de download automatizado.