將基於 Web 的文檔搜尋新增至我的 debian 檔案伺服器

將基於 Web 的文檔搜尋新增至我的 debian 檔案伺服器

我有一個基於 Samba 的文件伺服器,上面有大量數據,主要是 Word、Excel、OpenOffice 和 PDF 文件。

我已經建立了一個簡單的基於網路的搜尋介面(Apache、PHP、mlocate),它只在檔案路徑+ mtime 上進行。為此,它是有效的,但如果所有文件都由 Apache Solr 編制索引那就太好了,因為從各方面來看,這速度都非常快,並且可以處理所有這些不同的文件類型。

但它是一個文件伺服器,而不是一個網站,所以我需要一些東西來爬行所有文件,並繼續爬行和重新索引更新的文件;人們並不是「發布」文檔,而是按下「儲存」。

有沒有一個專案可以做到這一點?

答案1

查看inotify。它將立即通知您有關檔案系統事件的資訊。

答案2

我不確定這是否是提問者想要的,但其他人正在尋找一個網頁介面來移動定位,看看這個:

https://github.com/kaazoo/weblocate

相關內容