Qual é a estratégia para detectar desvios de tempo em um data center baseado em Linux?

Qual é a estratégia para detectar desvios de tempo em um data center baseado em Linux?

Qual é a estratégia para detectar desvios de tempo em todos os data centers baseados em Linux? Este é um problema mais difícil do que parece à primeira vista.

O desvio de tempo pode causar sérios problemas para determinados aplicativos e, muitas vezes, mesmo que o NTP esteja instalado, é possível falhar pelos seguintes (e muitos mais) motivos:

  • O NTP não foi configurado corretamente para reiniciar automaticamente na reinicialização.
  • As configurações em um servidor estão incorretas, portanto o servidor de horário para o qual ele aponta está inacessível ou impreciso.
  • O servidor de horário mestre está inacessível e todos os servidores que estão sincronizando com ele agora estão sincronizando com uma fonte não confiável.

Gostaria de detectar se todos os servidores individuais estão corretos. Tenha em mente que o servidor com o script/aplicativo de teste pode não estar correto.

Responder1

Isso é fácil de controlar. O gerenciamento de configuração é a chave...

Certifique-se de que o serviço NTP esteja em execução e configurado...

Por exemplo, usandoMonitorarcertificar-se ntpdde que está em execução e reiniciá-lo se falhar é uma abordagem fácil... Pode fazer sentido adicionar o cron e outros daemons essenciais a esse tipo de verificação.

Outra opção é usar umgerenciamento de configuraçõesferramenta comoFantochepara forçar o mesmo ntpd.conf em seus servidores e garantir que o ntpd esteja instalado, configurado e em execução.

Existem redundâncias suficientes no protocolo NTP para lidar com a instância de um servidor de horário inacessível. Especifique múltiplas fontes.

Responder2

Há uma variedade de plug-ins check_ntp paranagioslá fora.

Aqui está um:

http://nagiosplugins.org/man/check_ntp

Adicione esta verificação ao seu host nagios e receba alertas se algo der errado.

informação relacionada