Отправить оповещение, если системная служба выходит из строя centos

Отправить оповещение, если системная служба выходит из строя centos

Я хотел бы контролировать системную службу на наборе хостов, которые все работают под управлением CentOS. Статус можно легко получить из systemctl, но знает ли кто-нибудь способ отправить электронное письмо, если служба умирает (т. е. состояние службы не "работает")?

Я бы хотел избежать отправки сотен писем, если сервис не работает часами, что может означать отказ от краткосрочных заданий cron. Я бы хотел, может быть, одно письмо, если сервис не работает, возможно, даже одно в час, но даже это кажется слишком много.

Я слышал, что Nagios, Zabbix или Kapacitor могут подойти здесь, но я не уверен, какой из них лучше всего подойдет для решения такого типа проблем. Любой совет будет очень полезен.

решение1

Нагиосотправляет письмо на адрес электронной почты, когда пинг не возвращается. Вы можете настроить кучу опций;

check_period 24x7
check_interval 5
retry_interval 1
max_check_attempts 10
notification_period 24x7
notification_interval 30
notification_options d,u,r   

Примечательно, что вы можете увидеть опцию "интервал уведомления", которая является опцией для периода времени между оповещениями по электронной почте.
Недавно я заметил, что они добавилиПодтверждениесистема, в которой если система выходит из строя, вы можете «подтвердить» это, и она больше не будет отправлять уведомления.

Связанный контент