Número excesivo de procesos inactivos en CentOS: ¿cómo diagnosticarlos?

Número excesivo de procesos inactivos en CentOS: ¿cómo diagnosticarlos?

Tengo una gran cantidad de procesos inactivos, alrededor de 600, la mayoría de los cuales son procesos Apache.

¿Debo eliminar todos estos procesos inactivos o eso hará que Apache falle por completo?

¿Por qué estos procesos están dormidos en primer lugar?

El servidor ejecuta CentOS 6 con Apache 2.2.

Respuesta1

Eliminar todos los procesos inactivos de su sistema no resolverá ningún problema y mucho menos el problema que está teniendo.


Ser estructurado y metódico en tu enfoque es mucho mejor que andar por ahí salvajemente.

personalmente encuentroMétodo científico(otros lo llamanalgo diferente) una herramienta maravillosa para sacar del kit de administración del sistema al diagnosticar problemas.

  1. ¿Cuál es el problema real que estás intentando resolver?

Un servicio deja de responder. 1

  1. Entonces, ahora que sabemos cuál es el problema real que estamos resolviendo, tenemos alguna dirección. Recopilemos información que nos ayude a encontrar una solución.

    • ¿El problema está relacionado con el tiempo? ¿Sucede de forma regular o aleatoria?
    • Verifique sus registros, todos ellos, no solo los registros de los servicios en particular, ya que algo más puede estar causando el problema. Las entradas de registro generalmente tienen marcas de tiempo, esto es para ayudarlo a correlacionar eventos en múltiples aplicaciones y servicios; utilícelas. Si es necesario, aumente también la detalle del registro.
    • Observe lo que está haciendo su sistema. Utilice herramientas como top, vmstat, iostat, sar, ps,tcpdump o incluso completassistemas de monitoreo.

  2. Analiza la información que has recopilado. ¿Qué sucede realmente en el sistema cuando el servicio deja de responder? ¿Cuál es el estado de los recursos del sistema?

  3. Tome las medidas adecuadas para remediarlo. Con suerte, es bastante obvio lo que está pasando, te estás quedando sin memoria y OOM Killer entra en juego, tu actividad de intercambio es demasiado alta, tu cola de ejecución es demasiado larga, estás vinculado a IO, etc. Si no es obvio, entonces Probablemente no estés recopilando los datos correctos; ya sabes qué hacer, vuelve al punto 2.

  4. Monitorear qué hacen los cambios introducidos en 4.

  5. ¿Los cambios solucionaron el problema? ¿Es mejor? ¿Es peor? ¿No hay diferencia? Adónde vayas desde aquí depende de lo que encuentres. Es posible que deba volver a 2. y recopilar datos más pertinentes o 3. volver a analizar los datos que tiene o 4. porque identificó una serie de posibles soluciones.

  6. Documente sus hallazgos y los cambios que realizó.

  7. Vuelve a la cama/a casa desde el trabajo/al pub.

1 Esto podría ser cualquier cosa, como "Mi servidor es lento", "Mi servidor está usando demasiada memoria"...

información relacionada