遞歸 wget,向每個找到的 URL 附加一些內容

遞歸 wget,向每個找到的 URL 附加一些內容

我的主要目標是輕鬆備份我的一堆 MediaWiki 頁面的頁面來源。我有我想要下載的每個頁面,列在我的用戶名頁面上(https://wiki.example.com/index.php?title=用戶:用戶名)目前我可以:

wget -r --level=1 https://wiki.example.com/index.php?title=User:username

這會下載我連結的每個頁面的 MediaWiki 輸出 HTML,但我更喜歡每個頁面的源代碼。

透過 Mediawiki,我們可以加入action=raw到 GET 請求中,例如https://wiki.example.com/index.php?title=使用者:使用者名稱&action=raw將會取得 User: 使用者名稱的來源。

因此,我希望 wget 的 -r 將“&action=raw”附加到它找到並下載的每個其他連結的 URL,但我不確定如何操作。其他帖子談到這樣做,wget -A '&action=raw'但是這個接受標誌似乎並不能完成這項工作。

相關內容