Tengo un servidor de archivos basado en Samba con una gran cantidad de datos, principalmente documentos de Word, Excel, OpenOffice y PDF.
He configurado una interfaz de búsqueda simple basada en web (Apache, PHP, mlocate) que simplemente va en filepaths + mtime. Funciona para eso, pero sería genial tener todos los documentos indexados por Apache Solr, ya que según todos los informes, esto es increíblemente rápido y puede hacer frente a todos estos diferentes tipos de documentos.
Pero es un servidor de archivos, no un sitio web, por lo que necesitaría algo para rastrear todos los archivos y seguir rastreando y reindexando los actualizados; las personas no están "PUBLICANDO" documentos, simplemente presionan Guardar.
¿Existe algún proyecto que haga esto?
Respuesta1
Verificarinotificar.Le notificará instantáneamente sobre los eventos del sistema de archivos.
Respuesta2
No estoy seguro de si esto es lo que quiere el autor de la pregunta, pero otros que buscan una interfaz web para ubicar, miren esto: