我正在使用 DownThemAll 和一些正則表達式從網頁中抓取文件。
我的 DownThemAll 過濾器設定如下:/\.(?:pdf|doc|docx|xls|xlsx|ppt|zip)$/i
但是,每個頁面也包含文件 WBSDictionary.xls,我想排除該文件。
我已經嘗試過/(?!WBSDictionary)\.(?:pdf|doc|docx|xls|xlsx|ppt|zip)$/i
但沒有成功。我是否做錯了,或者 DTA 的正規表示式實作根本不支持這一點?
我對正規表示式很陌生。
答案1
嘗試包含帶有副檔名的文件pdf|doc|docx|xls|xlsx|ppt|zip
,同時排除該文件WBSDictionary.xls
/^(?!.*WBSDictionary\.xls$).*\.(pdf|doc|docx|xls|xlsx|ppt|zip)$/i
希望有幫助