Actualmente estoy intentando descargar datos del servidor https usando wget. Hay muchas subcarpetas y archivos, pero sólo una extensión de archivo (*.raw) me interesa. (Las carpetas principales no son deseadas)
Se han probado estos comandos:
wget --recursive --no-directories --no-parent --level 10 --accept "raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
y
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
Sin embargo, ingresar el mismo comando con uno de los directorios que contienen archivos de interés funciona (pero no es deseable, ya que debe hacerse manualmente).
wget --recursive --no-directories --no-parent --level 10 --accept .raw --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/TCGA_09-1664-01A_61-2094-01A_25-1312-01A_Proteome_JHUZ_20130802/TCGA_09-1664-01A_61-2094-01A_25-1312-01A_Proteome_JHUZ_20130802_raw/
¿Alguna idea de cómo formular el comando para obtener los archivos? Gracias de antemano, Vivian.
Respuesta1
Esta simple edición del primer comando resuelve el problema.
wget --recursive -nd --no-parent --level 10 --accept "*.raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/