在基於 Linux 的資料中心中偵測時間漂移的策略是什麼?

在基於 Linux 的資料中心中偵測時間漂移的策略是什麼?

在所有基於 Linux 的資料中心中檢測時間漂移的策略是什麼?這是一個比乍看之下更困難的問題。

時間漂移可能會導致某些應用程式出現嚴重問題,即使安裝了 NTP,也通常可能因以下(以及更多)原因而失敗:

  • NTP 未正確設定為在重新啟動時自動重新啟動。
  • 伺服器上的設定不​​正確,因此它指向的時間伺服器無法存取或不準確。
  • 主時間伺服器無法訪問,所有與其同步的伺服器現在正在同步到不可靠的來源。

我想要一種方法來檢測所有單獨的伺服器是否正確。請記住,帶有測試腳本/應用程式的伺服器可能不正確。

答案1

這很容易控制。組態管理是關鍵...

確保 ntp 服務正在運行並配置...

例如,使用莫尼特確保ntpd正在運行並在失敗時重新啟動它是一種簡單的方法...將 cron 和其他基本守護程序添加到此類檢查中可能是有意義的。

另一個選擇是使用配置管理類似工具木偶強制您的伺服器使用相同的 ntpd.conf,並確保 ntpd 已安裝、設定並執行。

NTP 協定中有足夠的冗餘來處理時間伺服器無法存取的情況。指定多個來源。

答案2

有多種 check_ntp 插件納吉奧斯在那裡。

這是一個:

http://nagiosplugins.org/man/check_ntp

將此檢查新增至您的 nagios 主機,並在出現任何問題時收到警報。

相關內容