
Estamos ejecutando un servidor Jenkins con múltiples nodos. Después de un tiempo y de que se agregaron cada vez más proyectos a la instancia, nos encontramos con múltiples problemas (que tenemos que resolver con muy pocas personas, pero ese es otro tema).
Uno realmente preocupante es el tamaño de la VM que utilizamos como servidor. Supera los 10 TB de datos almacenados y solo crecerá (necesitamos acceder a los artefactos años/décadas después).
La pregunta para mí en este punto es generalmente si alguien tiene alguna experiencia con estas grandes instalaciones y puede darme algunas estimaciones de lo que podría pasar con el sistema de orificios si no se cuida adecuadamente y qué medidas recomendadas deberíamos tomar a partir de ahora.
No está claro hacia dónde queremos llegar a partir de ahora. Sólo quiero algunas opiniones sobre lo que harían personas más experimentadas.
Respuesta1
La planificación de la capacidad también incluye decirle a la organización cuánto cuesta su forma actual de hacer las cosas.
Calcule cuánto espacio necesitará para el próximo año aproximadamente. Redondeando un poco, planear estar lleno al 75% proporciona un pequeño margen. Agregue los costos que espera no solo de la capacidad utilizable, sino también de exceder el tamaño máximo de un LUN/sistema de archivos/matriz de almacenamiento. Más costos de almacenamiento y respaldo redundantes.
Proporcionar alternativas que cuesten menos.
"Descartar compilaciones antiguas" es una opción de Jenkins que controla la retención. Los requisitos reales pueden salir a la luz cuando se conozca el precio. Sin embargo, muchas organizaciones no pagan directamente las facturas de TI, por lo que es posible que a su unidad de negocios no le importe.
Analice con cuánta antelación se pueden solicitar los artefactos antiguos. Obtenerlo en unos días significa que podría estar en un nivel de almacenamiento en frío. Las cintas de respaldo pueden ser mucho más económicas que un sistema en línea. Y un sistema de respaldo separado con diferentes medios mejora las probabilidades de que los datos sobrevivan "décadas". Descubra cuántas décadas, tener hardware y personas disponibles para mantener datos de cuarenta años puede resultar costoso.
Descubra cuán reproducibles son las salidas. Si todas las entradas están en control de versiones y la salida es consistente, es posible que no sea necesario archivar las salidas por tanto tiempo. Aunque esto requiere procedimientos disciplinados.En particular, no es fácil crear software para que los resultados sean deterministas.