
Qual é a estratégia para detectar desvios de tempo em todos os data centers baseados em Linux? Este é um problema mais difícil do que parece à primeira vista.
O desvio de tempo pode causar sérios problemas para determinados aplicativos e, muitas vezes, mesmo que o NTP esteja instalado, é possível falhar pelos seguintes (e muitos mais) motivos:
- O NTP não foi configurado corretamente para reiniciar automaticamente na reinicialização.
- As configurações em um servidor estão incorretas, portanto o servidor de horário para o qual ele aponta está inacessível ou impreciso.
- O servidor de horário mestre está inacessível e todos os servidores que estão sincronizando com ele agora estão sincronizando com uma fonte não confiável.
Gostaria de detectar se todos os servidores individuais estão corretos. Tenha em mente que o servidor com o script/aplicativo de teste pode não estar correto.
Responder1
Isso é fácil de controlar. O gerenciamento de configuração é a chave...
Certifique-se de que o serviço NTP esteja em execução e configurado...
Por exemplo, usandoMonitorarcertificar-se ntpd
de que está em execução e reiniciá-lo se falhar é uma abordagem fácil... Pode fazer sentido adicionar o cron e outros daemons essenciais a esse tipo de verificação.
Outra opção é usar umgerenciamento de configuraçõesferramenta comoFantochepara forçar o mesmo ntpd.conf em seus servidores e garantir que o ntpd esteja instalado, configurado e em execução.
Existem redundâncias suficientes no protocolo NTP para lidar com a instância de um servidor de horário inacessível. Especifique múltiplas fontes.
Responder2
Há uma variedade de plug-ins check_ntp paranagioslá fora.
Aqui está um:
http://nagiosplugins.org/man/check_ntp
Adicione esta verificação ao seu host nagios e receba alertas se algo der errado.