Activar las opciones de aceptar/rechazar en wget cambia el comportamiento de descarga de archivos

2024-6-10 • tag-icon

Activar las opciones de aceptar/rechazar en wget cambia el comportamiento de descarga de archivos

Estoy intentando conectarme a un sitio de Sharepoint y recuperar libros de Excel de una carpeta específica. Los problemas que tengo son principalmente que wget recupera archivos de todos los niveles. Aquí está el código que estoy usando:

wget --http-user='someuser' --http-password="somepassword" -r -l 1 --no-remove-listing 
"http://somehost.com/lvl1/lvl2/lvl3/lvl4/lvl5/lvl6/" -nd --cut-dirs 5 --random-wait

Donde lvl6 es el directorio en el que se encuentran mis archivos. Lo que hace este comando es extraer todos los archivos de lvl1 a lvl6. Intenté solucionar esto agregando

--accept xlsx --reject aspx

hasta el final del comando (ya que la mayoría de los archivos extraños son aspx). Pero, extrañamente, esto sólo hace que wget busque solo un archivo index.html.

Hasta ahora, he intentado cambiar el número de niveles recursivos (0 a 20), agregar --no-parent y algunas otras opciones que no funcionaron. ¿Algunas ideas?

información relacionada