我的文件中有一個 URI 列表uris.txt
:
http://example.com/file1.pdf
http://example.com/file2.pdf
http://example.com/Folder/file3.pdf
http://example.com/Folder/Subfolder/file4.pdf
我的 HDD 上的最終目錄結構應該如下所示:
|
|-file1.pdf
|-file2.pdf
|-Folder
|-file3.pdf
|-Subfolder
|-file4.pdf
我目前的命令是:wget -i uris.txt -P downloads
不幸的是,wget 會展平所有目錄,即檔案名稱是透過連接基底目錄(由命令列上的 -P 給出)和 URI 路徑的最後部分來確定的。
維護伺服器所服務的目錄結構是可能的,儘管只有透過遞迴模式,它僅在 HTML 和 CSS 上運行,而不是在給定的 URI 列表上運行。
答案1
您可以使用額外的選項 -x
or--force-directories
和-nH
or--no-host-directories
來避免 example.com 頂級目錄。
答案2
建議閱讀,它將在其中提供答案面向未來方式:
man wget
尋找--no-host-directories
和--cut-dirs=number
--無主機目錄
將使 wget 跳過建立一個名為「example.com」的目錄來放置所有資料。
--cut-dirs=數字
對於子目錄也會做同樣的事情number
,從頂部開始計數。