Estoy intentando conectarme a un sitio de Sharepoint y recuperar libros de Excel de una carpeta específica. Los problemas que tengo son principalmente que wget recupera archivos de todos los niveles. Aquí está el código que estoy usando:
wget --http-user='someuser' --http-password="somepassword" -r -l 1 --no-remove-listing
"http://somehost.com/lvl1/lvl2/lvl3/lvl4/lvl5/lvl6/" -nd --cut-dirs 5 --random-wait
Donde lvl6 es el directorio en el que se encuentran mis archivos. Lo que hace este comando es extraer todos los archivos de lvl1 a lvl6. Intenté solucionar esto agregando
--accept xlsx --reject aspx
hasta el final del comando (ya que la mayoría de los archivos extraños son aspx). Pero, extrañamente, esto sólo hace que wget busque solo un archivo index.html.
Hasta ahora, he intentado cambiar el número de niveles recursivos (0 a 20), agregar --no-parent y algunas otras opciones que no funcionaron. ¿Algunas ideas?