Утечка памяти на веб-сервере

Question

Увеличьте sar и выводите таблицу ps каждую минуту. Смотрите мой подробный ответздесь.

В следующий раз, когда сервер взорвется, используйте sar -r, чтобы помочь отследитькогдаэто произошло. Теперь используйте вывод из ps-cronjob или из моегоperl-обертка для ps на github, чтобы выяснить, какой процесс мог быть виновником.

Допустим, сервер взорвался между 12:00:00 и 13:00:00. Используйте sar -r -s 12:00:00 -e 13:00:00. Из этого вы должны увидеть всплеск в данных. (Если это проще, есть утилита на основе Java для построения графиков, но обычно это не стоит усилий.) Допустим, вы видите всплеск (или провал) в 12:15. Теперь просмотрите столбчатый вывод ps на предмет временного диапазона между, скажем, 12:00 и 12:15, отсортируйте его по pid, а затем по времени и посмотрите на столбцы памяти:

awk '/^=== .* 12:00:/,/^=== .* 12:16:/' /var/log/sa/ps/today |
 sort -k 1n -k 16

(Параметры сортировки предполагают, что время находится в столбце 16, что может быть, а может и не быть правдой). Теперь вы можете снова отфильтровать этот вывод через awk, чтобы найти различия между строками вывода:

... | awk 'lastpid && lastpid==$1 && last != $0 { print} /^[0-9]/ { lastpid=$1;last=$0; }'

Это довольно грубый фильтр. Для некоторых процессов (чьи командные строки постоянно меняются, например, с mysql, postgresql и snmpd) это не очень поможет, но, надеюсь, вы сможете настроить awk, чтобы помочь вам найти виновника(ов).

Answer 1