Número excessivo de processos adormecidos no CentOS - como diagnosticar?

Número excessivo de processos adormecidos no CentOS - como diagnosticar?

Eu tenho um grande número de processos inativos, cerca de 600, a maioria dos quais são processos Apache.

Devo eliminar todos esses processos adormecidos ou isso fará com que o Apache falhe completamente?

Em primeiro lugar, por que esses processos estão adormecidos?

O servidor está executando o CentOS 6 com Apache 2.2.

Responder1

Eliminar todos os processos inativos do seu sistema não resolverá nenhum problema, muito menos o problema que você está enfrentando.


Ser estruturado e metódico em sua abordagem é muito melhor do que ficar agitado.

Pessoalmente eu achoMétodo científico(outros chamamalgo diferente) uma ferramenta maravilhosa para retirar do kit de administração do sistema ao diagnosticar problemas.

  1. Qual é o problema real que você está tentando resolver?

Um serviço para de responder. 1

  1. Então, agora que sabemos qual é o problema real que estamos resolvendo, temos alguma direção. Vamos reunir algumas informações para nos ajudar a descobrir uma solução.

    • O problema está relacionado ao tempo? Isso acontece regularmente ou aleatoriamente.
    • Verifique seus logs, todos eles, não apenas os logs de serviços específicos, pois algo mais pode estar causando o problema. As entradas de log geralmente têm carimbos de data e hora. Isso ajuda a correlacionar eventos em vários aplicativos e serviços - use-os. Se necessário, aumente também o detalhamento do log.
    • Observe o que seu sistema está fazendo. Use ferramentas como top, vmstat, iostat, sar, ps, tcpdump ou até mesmo full-blownsistemas de monitoramento.

  2. Analise as informações que você coletou. O que realmente está acontecendo no sistema quando o serviço para de responder? Qual é o estado dos recursos do sistema?

  3. Tome as medidas apropriadas para remediar. Espero que seja bastante óbvio o que está acontecendo, você está ficando sem memória e o OOM killer sai para jogar, sua atividade de troca está muito alta, sua fila de execução é muito longa, você está preso etc. provavelmente não estamos coletando os dados corretos – você sabe o que fazer, volte para 2.

  4. Monitore o que as mudanças introduzidas em 4. fazem.

  5. As mudanças resolveram o problema? É melhor? É pior? Não há diferença? Para onde você vai a partir daqui depende do que você encontrar. Talvez seja necessário voltar ao ponto 2. e coletar dados mais pertinentes ou 3. para reanalisar os dados que você possui ou 4. porque você identificou uma série de soluções potenciais.

  6. Documente suas descobertas e as alterações feitas.

  7. Volte para a cama/casa do trabalho/para o pub.

1 Pode ser qualquer coisa, 'Meu servidor está lento', 'Meu servidor está usando muita memória' ...

informação relacionada