如何找到網站上所有出現的電子郵件地址

如何找到網站上所有出現的電子郵件地址

假設我有一個大型網站,其中可能有許多被垃圾郵件發送者接收的電子郵件地址。我計劃將它們全部混淆或刪除。

抓取我的網站以查找我可能暴露的任何電子郵件地址的最簡單方法是什麼?

透過頁面上的文字(Google 可以識別,但不是很好)或 mailto: 連結(Google 不能)。

答案1

就像是:

wget --mirror --html-extension http://www.mydomain.org/ -o /home/user/temp_site/

然後

grep -Hinr "@mydomain.org" /home/user/temp_site/ > /home/user/list_of_pages_with_email

應傳回包含您的網域電子郵件地址的所有頁面(帶有行號)的清單。

可能需要調整。

手冊用於獲取grep

相關內容