
Gostaria de monitorar um serviço do sistema em um conjunto de hosts que executam centos. O status pode ser facilmente obtido no systemctl, mas alguém conhece uma maneira de enviar um email se o serviço morrer (ou seja, o estado do serviço não está "em execução")?
Gostaria de evitar o envio de centenas de e-mails se o serviço ficar inativo por horas seguidas, o que pode significar evitar cron jobs de curto prazo. Eu gostaria de receber talvez 1 e-mail se o serviço cair, possível até 1 por hora, mas mesmo isso parece muito.
Ouvi dizer que Nagios, Zabbix ou Kapacitor podem ser adequados aqui, mas não tenho certeza de qual seria o melhor para resolver esse tipo de problema. Qualquer conselho seria muito útil.
Responder1
Nagiosenvia um e-mail para um endereço de e-mail quando um ping não retorna. Você pode configurar várias opções;
check_period 24x7
check_interval 5
retry_interval 1
max_check_attempts 10
notification_period 24x7
notification_interval 30
notification_options d,u,r
Notavelmente, você pode ver uma opção para “intervalo de notificação”, que é a opção para o período de tempo entre alertas por e-mail.
Recentemente notei que eles adicionaram umReconhecimentosistema, onde se um sistema falhar, você pode "reconhecê-lo" e ele não enviará mais notificações.