Requisitos del sistema de Lucene.NET

Requisitos del sistema de Lucene.NET

¿Alguien con experiencia en la implementación/ejecución de una solución Lucene.NET puede recomendar especificaciones aproximadas del sistema para un entorno real? ¿Es intensivo el procesador, la memoria o el disco? ¿Solo utiliza un único procesador, por lo que tener una caja con multiprocesadores/núcleos no arrojaría muchos beneficios, etc.?

Esto es para un desarrollo totalmente nuevo, por lo que no existe un sistema relevante para basar el uso. Se espera que los datos que indexaríamos contuvieran 200.000 documentos (clientes) y contuvieran elementos estándar como nombre, detalles de contacto y un par de direcciones, por lo que cada registro no sería demasiado grande.

Es útil que necesitemos comenzar con nuestras recomendaciones de hardware antes de que realmente tengamos la oportunidad de crear una solución de prueba, y el hardware que existe actualmente haría que cualquier prueba fuera difícil de comparar o sacar conclusiones.

Respuesta1

No obtendrá una respuesta decente ya que depende totalmente de lo que haga (número y complejidad de las consultas), así como del tamaño del almacenamiento.

Se espera que los datos que indexaríamos contuvieran 200.000 documentos (clientes) y contuvieran elementos estándar como nombre, detalles de contacto y un par de direcciones, por lo que cada registro no sería demasiado grande.

Para empezar, cuestionaría la selección de Lucene como tecnología adecuada aquí. Parece ser "la única herramienta que conozco es ah ammer, así que hago que mi problema parezca un clavo".

Lucene no es una base de datos genérica, es un sistema de búsqueda de índice de texto completo de documentos. tiene serias limitaciones así como también serias fortalezas. Cualquier dato que no sea un documento (libreta de direcciones, etc.) NO lo almacenaría en algo como lucene.

Dicho esto, 200.000 documentos suena como un tamaño terrible... mediocre. Probablemente esté de acuerdo con un "sistema decente". En cuanto al disco, mi apuesta siempre es usar un Velociraptor Raid 10 para el almacenamiento de datos si el rendimiento se convierte en un problema, pero incluso entonces el controlador del disco duro puede marcar una gran diferencia.

información relacionada