Usando wget con Streamcloud y páginas donde hay que esperar

Usando wget con Streamcloud y páginas donde hay que esperar

Soy nuevo en las secuencias de comandos bash y, como escuché sobre "wget", decidí escribir una secuencia de comandos para descargar solo el archivo .mp4 desde un enlace de streamcloud (o lo que sea).

Lo uso normalmente como:

wget -q -O - http://somelink.com | grep keyword

Pero el problema que tengo es que obtengo la fuente del sitio donde tengo que esperar unos segundos hasta "ir al video", y obviamente no es ahí donde puedo encontrar el enlace del archivo mp4. Así que me gustaría saber cómo puedo obtener la fuente de la página a la que llegas después de la espera, donde puedes ver el video y cuya fuente contiene el enlace mp4 (entonces podría buscarlo).

De hecho, puedo obtener el enlace mp4 manualmente, pero solo me gustaría automatizarlo mediante un script de shell.

¡Muchas gracias! ¡Cualquier ayuda sería apreciada!

Respuesta1

Debe guardar la salida de wget en un archivo y mirar el html para ver cómo están implementando el tiempo de espera y la redirección. Hay varias técnicas que podrían estar utilizándose. Por ejemplo, la más sencilla es una línea como esta en el encabezado del html:

<meta http-equiv="refresh" content="2;url=http://newurl/"> 

Esto hace que el navegador acceda a la nueva URL después de 2 segundos. Debe utilizar una herramienta como sed para extraer la URL y luego ejecutar wget nuevamente en la nueva URL.

Las soluciones más complicadas involucran javascript.

información relacionada