Ich versuche gerade, mit wget Daten vom https-Server herunterzuladen. Es gibt jede Menge Unterordner und Dateien, aber nur eine Dateierweiterung (*.raw) interessiert mich. (Übergeordnete Ordner sind nicht erwünscht)
Diese Befehle wurden ausprobiert:
wget --recursive --no-directories --no-parent --level 10 --accept "raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
Und
wget --mirror --convert-links --adjust-extension --page-requisites --no-parent https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/
Die Eingabe des gleichen Befehls in einem der Verzeichnisse, die die gewünschten Dateien enthalten, funktioniert jedoch (ist aber nicht erwünscht, da dies manuell erfolgen sollte).
wget --recursive --no-directories --no-parent --level 10 --accept .raw --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/TCGA_09-1664-01A_61-2094-01A_25-1312-01A_Proteome_JHUZ_20130802/TCGA_09-1664-01A_61-2094-01A_25-1312-01A_Proteome_JHUZ_20130802_raw/
Irgendeine Idee, wie man den Befehl zum Abrufen der Dateien formuliert? Vielen Dank im Voraus, Vivian
Antwort1
Diese einfache Bearbeitung des ersten Befehls löst das Problem.
wget --recursive -nd --no-parent --level 10 --accept "*.raw" --execute robots=off https://cptc-xfer.uis.georgetown.edu/publicData/Phase_II_Data/TCGA_Ovarian_Cancer_S_026/