Высокая нагрузка на сервер Nagios. Какое количество проверок служб для сервера Nagios считается слишком большим?

Высокая нагрузка на сервер Nagios. Какое количество проверок служб для сервера Nagios считается слишком большим?

У меня есть сервер nagios, работающий под управлением Ubuntu с процессором Intel 2,0 ГГц, массивом RAID10 и 400 МБ ОЗУ. Он отслеживает в общей сложности 42 службы на 8 хостах, большинство из которых проверяются с помощью плагина check_http каждые 5 минут, некоторые каждую минуту. Недавно нагрузка на сервер nagios превысила 4, часто достигая 6. На сервере также запущен cacti, собирающий статистику каждую минуту для 6 хостов.

Интересно, сколько сервисов должно обрабатывать такое оборудование? Нагрузка такая высокая, потому что я выжимаю максимум из оборудования, или оно должно обрабатывать 42 сервисных проверки плюс кактусы? Если оборудование неадекватно, стоит ли мне добавить больше оперативной памяти, больше ядер или более быстрые ядра? Какие аппаратные/сервисные проверки запускают другие?

решение1

Вам нужно выяснить, где у вас узкое место...

Я запускаю монитор Nagios, который проверяет более 400 хостов с помощью проверок http, ping и ssh (наряду со множеством других пассивных проверок и nscd).

Это сервер 2xQuadCore с 4 дисками SAS в RAID10.

Подозреваю, что у вас конфликт ввода-вывода, поскольку запись на множество rrd очень неэффективна.

Вам нужно выяснить, какой процесс потребляет ваши ресурсы. (cacti, nagios или что-то еще)

Для проверки ввода-вывода мне нравится iotop. Установите iotop (пакет 9.04 работает на 8.04)

Но в остальном top также должен помочь вам найти своего «пожирателя нагрузки».

Кактусы раз в минуту довольно агрессивны. (Я запускаю свои с интервалом в 5 м)

Один из подходов, о котором я слышал для решения проблемы состязаний при записи на rrd, заключается в размещении хранилищ rrd на ramdisk/tmpfs. (Не забудьте время от времени синхронизировать его с постоянным хранилищем rsync)

Удачи.

решение2

Если только основную нагрузку не создают кактусы, то вы сможете выполнить гораздо больше проверок на своем оборудовании.

Я запускаю nagios на виртуальной машине FreeBSD, работающей на Microsoft Virtual Server на старом, очень медленном ПК (Pentium 3 1 ГГц с медленным диском PATA). У виртуальной машины всего 128 МБ ОЗУ, и производительность ужасная.

Однако средняя нагрузка составляет около 0,2 при выполнении 158 проверок на 42 хостах.

решение3

На старом PIII с 256 МБ ОЗУ я активно отслеживаю около 230 различных сервисов. На той же машине также запущены MRTG и HylaFAX для всех наших входящих факсов, и все это происходит довольно комфортно.

решение4

Вы должны быть в состоянии запустить кучу проверок Nagios с этим оборудованием. Мы запускаем похожую установку с примерно 70 проверками и Nagiosgraph - основное отличие в добавленной оперативной памяти (она дешевая, поэтому я бы увеличил объем до 2 ГБ).

Попробуйте запустить top или ps -aux, чтобы проверить, не перегружен ли процессор, но я сомневаюсь. Вы также можете проверить nagiosдокументы по распараллеливаниючтобы проверить, не пытается ли ваша установка запустить слишком много проверок одновременно, а не сериализовать их.

Связанный контент