Tenemos una configuración de clúster de 3 servidores, en los 3 servidores se ejecuta weblogic para alojar el sitio web. En la parte superior de weblogic usando Apache como equilibrador de carga.
El año pasado actualicé el servidor http Apache de 2.4.9 a 2.4.29. Antes de la actualización, todo funcionaba bien, pero después de la actualización, cada 2 a 4 semanas, Apache se bloquea. El sitio web se vuelve inaccesible, al verificar el servidor no vemos ningún error; de hecho, en el momento en que Apache se cuelga, también deja de iniciar sesión.
Monitoreamos y no encontramos ningún uso anormal de la memoria, ningún tipo de solicitud sospechosa al sitio web ni ningún proceso sospechoso ejecutándose antes de que ocurriera el problema.
Después de explorar Internet, descubrí que el problema podría estar relacionado con la configuración de MPM. Apache estaba usando el evento MPM pero descubrí que la configuración del evento MPM no estaba declarada en la configuración de Apache, creo que durante la actualización la configuración predeterminada fue reemplazada por la configuración anterior.
Así que modificamos la configuración de MPM para usar la configuración de mpm del evento siguiente y este cambio funcionó. No enfrentamos este problema durante los próximos 6 meses.
StartServers 4 MinSpareThreads 256 MaxSpareThreads 512 ThreadsPerChild 64 MaxRequestWorkers 2048 MaxConnectionsPerChild 0
Pensamos que estaba solucionado, pero ahora, después de 6 meses, Apache se cuelga nuevamente, solo podemos ver síntomas que aumentan las conexiones de close_wait de 20 a 550 en la próxima hora, no hay acceso al sitio web, Apache dejó de iniciar sesión en su SSL y registros de errores, no lo hacemos. No veo ningún comportamiento anormal en diferentes datos de procesos en ejecución, uso de memoria, ni veo ninguna solicitud sospechosa antes de que ocurriera el problema.