使用正規表示式和 DownThemAll 來排除檔案名

使用正規表示式和 DownThemAll 來排除檔案名

我正在使用 DownThemAll 和一些正則表達式從網頁中抓取文件。

我的 DownThemAll 過濾器設定如下:/\.(?:pdf|doc|docx|xls|xlsx|ppt|zip)$/i

但是,每個頁面也包含文件 WBSDictionary.xls,我想排除該文件。

我已經嘗試過/(?!WBSDictionary)\.(?:pdf|doc|docx|xls|xlsx|ppt|zip)$/i但沒有成功。我是否做錯了,或者 DTA 的正規表示式實作根本不支持這一點?

我對正規表示式很陌生。

答案1

嘗試包含帶有副檔名的文件pdf|doc|docx|xls|xlsx|ppt|zip,同時排除該文件WBSDictionary.xls

/^(?!.*WBSDictionary\.xls$).*\.(pdf|doc|docx|xls|xlsx|ppt|zip)$/i

希望有幫助

相關內容