La cuestión
Tengo un servidor que llega a pm.max_children (200) sin picos en el uso de la CPU. No hay tráfico de red (MB de salida/MB de entrada), pero sí un número extremadamente alto de sockets asignados que no se cierran.
Procesador: 16 núcleos RAM: 64 GB
Imágenes de mi sistema de monitor Prometheus.
Tráfico de red, mira el agujero.
Ningún socket llega al punto TCP_tw, se atasca en TCP_alloc
Gran aumento en el uso de encajes
Para mitigar este problema tengo que reiniciar manualmente php-fpm. De lo contrario, quedará completamente bloqueado para nuevas conexiones.
Uso de CPU, cae con fuerza
Actualizar
Sospecho que esto se debe a que las tablas quedan bloqueadas en la base de datos durante un período prolongado de tiempo, lo que hace que todas las conexiones que intentan acceder a esos datos esperen y terminan atascadas en una gran pila de conexiones.
Actualmente estoy configurando un exportador de Mysql para ver si puedo encontrar más.