Что может вызвать ошибку ядра out_of_memory?

Question 1

Проверьте сообщения журнала на наличие признаков убийцы ядра из-за нехватки памяти или OOM killedв выводе dmesg. Это может дать некоторое представление о том, какой процесс(ы) был целью убийцы OOM. Также взгляните на следующее:

http://lwn.net/Articles/317814/

и

http://linux-mm.org/OOM_Killer

Что делает эта система? Вы одновременно исчерпываете swap? Похоже, проблема в rsyslogd, судя по вашей внешней ссылке, описывающей сбой. Это может быть ситуация, когда периодический перезапуск приложения был бы полезен.

Answer

Проверьте сообщения журнала на наличие признаков убийцы ядра из-за нехватки памяти или OOM killedв выводе dmesg. Это может дать некоторое представление о том, какой процесс(ы) был целью убийцы OOM. Также взгляните на следующее:

http://lwn.net/Articles/317814/

и

http://linux-mm.org/OOM_Killer

Что делает эта система? Вы одновременно исчерпываете swap? Похоже, проблема в rsyslogd, судя по вашей внешней ссылке, описывающей сбой. Это может быть ситуация, когда периодический перезапуск приложения был бы полезен.

Question 2

2.6.18 — очень старое ядро. Я столкнулся с проблемами, когда определенные условия могли вызвать бесконечные циклы в ядре, что приводило к тому, что все, от исчерпания памяти до пропускной способности ввода-вывода, полностью использовалось для сброса одних и тех же данных на диск в бесконечном цикле (что вызывало скачки нагрузки, но при этом нормально использовало ЦП).

Такие ошибки, как правило, исправляются вскоре после сообщения о них, поэтому обновление ядра — это простое решение проблемы. К тому же обновление ядра означает, что вы получите некоторые исправления безопасности бесплатно :-)

Answer

2.6.18 — очень старое ядро. Я столкнулся с проблемами, когда определенные условия могли вызвать бесконечные циклы в ядре, что приводило к тому, что все, от исчерпания памяти до пропускной способности ввода-вывода, полностью использовалось для сброса одних и тех же данных на диск в бесконечном цикле (что вызывало скачки нагрузки, но при этом нормально использовало ЦП).

Такие ошибки, как правило, исправляются вскоре после сообщения о них, поэтому обновление ядра — это простое решение проблемы. К тому же обновление ядра означает, что вы получите некоторые исправления безопасности бесплатно :-)

Question 3

С другой стороны, не забывайте, что Cacti и подобные им программы создают графики с определенным разрешением (collectd по умолчанию составляет 5 с, Cacti, по-моему, 30 с), поэтому у вас есть период в 30-60 секунд, который не обязательно отображается на ваших графиках... если система полностью зависла, это также повлияет на демон сбора данных.

Дополнительную полезную информацию вы можете найти в файлах журналов, будь то общие /var/log/messages или специфичные для службы /var/log/apache2/error.log.

Если вы не можете этого сделать, то я бы рекомендовал вам просмотреть свои службы (я заметил apache2 в приведенном выше отрывке из журнала) и проверить, способны ли они вызвать ситуацию исчерпания памяти на вашем сервере. (например: конфигурация Apache по умолчанию с mod_prefork и php должна быть способна остановить вашу систему).

Answer

С другой стороны, не забывайте, что Cacti и подобные им программы создают графики с определенным разрешением (collectd по умолчанию составляет 5 с, Cacti, по-моему, 30 с), поэтому у вас есть период в 30-60 секунд, который не обязательно отображается на ваших графиках... если система полностью зависла, это также повлияет на демон сбора данных.

Дополнительную полезную информацию вы можете найти в файлах журналов, будь то общие /var/log/messages или специфичные для службы /var/log/apache2/error.log.

Если вы не можете этого сделать, то я бы рекомендовал вам просмотреть свои службы (я заметил apache2 в приведенном выше отрывке из журнала) и проверить, способны ли они вызвать ситуацию исчерпания памяти на вашем сервере. (например: конфигурация Apache по умолчанию с mod_prefork и php должна быть способна остановить вашу систему).

Что может вызвать ошибку ядра out_of_memory?

Обновлять:

Обновление 2:

решение1

решение2

решение3

Связанный контент