
Me encontré con un sitio web cuyas páginas web consisten únicamente en JavaScript. Este sitio web alberga vídeos que me gustaría reflejar. Cuando abro este sitio web en Firefox y leo la fuente de la página, veo las importaciones de JavaScript en etiquetas de script. Cuando inspecciono la página en Firefox, veo HTML, incluida una etiqueta de vídeo. Supongo que JavaScript ha generado ese HTML. (No he programado JavaScript, por lo que no conozco sus complejidades).
¿Cómo hago para expandir JavaScript después de descargar la página original? Busco una herramienta de línea de comandos que haga esto. El HTML resultante debe ser analizado mediante expresiones regulares para extraer el nombre del archivo fuente del vídeo. Mi idea actual de un script bash que captura el vídeo está estructurada de la siguiente manera:
wget the.website.com/page/of/javascript/;
cat inThePage.html |
executeJavaScriptAndBuildHTML |
sed "the HTML and extract the video file name" |
while read aVideoFileName; do
wget $aVideoFileName;
done
Me pregunto si existe tal herramienta; Por lo general, JavaScript se ejecuta en el contexto de un navegador web GUI completo.
Tengo el presentimiento de que el objetivo de la página de solo JavaScript es evitar este tipo de descarga automática.