Vazamento de memória no servidor web

Question

Aumente o sar e produza a tabela ps a cada minuto. Veja minha resposta detalhadaaqui.

Na próxima vez que o servidor explodir, use sar -rpara ajudar a rastrearquandoaconteceu. Agora use a saída do ps-cronjob ou do meuwrapper perl para ps no github, para descobrir qual processo pode ter sido o culpado.

Digamos que o servidor explodiu entre 12h00:00 e 13h00:00. Usar sar -r -s 12:00:00 -e 13:00:00. A partir disso, você deverá ver um aumento nos dados. (Se for mais fácil, existe um utilitário baseado em Java para fazer gráficos, mas geralmente não vale a pena.) Digamos que você veja um pico (ou uma depressão) às 12h15. Agora verifique a saída ps em colunas para um intervalo de tempo entre, digamos, 12h e 12h15, classifique-o por pid e depois por hora e observe as colunas de memória:

awk '/^=== .* 12:00:/,/^=== .* 12:16:/' /var/log/sa/ps/today |
 sort -k 1n -k 16

(As opções de classificação assumem que a hora está na coluna 16, o que pode ou não ser o caso). Agora você pode filtrar essa saída através do awk novamente para encontrar diferenças entre as linhas de saída:

... | awk 'lastpid && lastpid==$1 && last != $0 { print} /^[0-9]/ { lastpid=$1;last=$0; }'

Esse é um filtro bastante grosseiro. Para alguns processos (cuja linha de comando muda o tempo todo, como mysql, postgresql e snmpd), isso não será muito útil, mas espero que você possa ajustar o awk para ajudá-lo a encontrar o(s) culpado(s).

Answer 1