Atualmente estou tentando baixar dados do servidor https usando wget. Existem muitas subpastas e arquivos, mas apenas uma extensão de arquivo (*.raw) me interessa. (As pastas principais não são desejadas)
Estes comandos foram tentados:
wget --recursive --no-directories --no-parent --level 10 --accept "raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
e
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
No entanto, inserir o mesmo comando em um dos diretórios que contém os arquivos de interesse está funcionando (mas não é desejado, pois deveria ser feito manualmente)
wget --recursive --no-directories --no-parent --level 10 --accept .raw --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/TCGA_09-1664-01A_61-2094-01A_25-1312-01A_Proteome_JHUZ_20130802/TCGA_09-1664-01A_61-2094-01A_25-1312-01A_Proteome_JHUZ_20130802_raw/
Alguma ideia de como formular o comando para obter os arquivos? Desde já agradeço, Vivian
Responder1
Esta simples edição do primeiro comando resolve o problema.
wget --recursive -nd --no-parent --level 10 --accept "*.raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/