Nagios 如何在 RAM 不足的情況下持續發送警報?

Nagios 如何在 RAM 不足的情況下持續發送警報?

假設我正在嘗試使用 Nagios 監控一個機器,但有一個失控的進程竊取了電腦近 100% 的 CPU 和 RAM。在這種情況下,Nagios 如何繼續提醒我有關盒子的狀態?如何阻止失控進程阻止 Nagios 運作?

答案1

如果受監控的伺服器過載,Nagios 或任何其他監控程式將無法在該伺服器上運作。

但不用擔心,您將收到寶貴的警報:您將認識到監控伺服器的每個 Nagios 測試都會逾時的情況。

不過,如果您的意思是您的所有內容(包括 Nagios)都在同一台伺服器上運行,那麼您的 Nagios 很容易突然死亡。始終擁有一個單獨的監控伺服器,否則監控將毫無用處:它會在您真正需要它的那一刻停止運作!

您也可以考慮設定一些資訊監視器,例如平均負載。如果平均負荷超過某個臨界點,讓 Nagios 發出警告。

使用 MRTG、Cacti 或 Nagiosgraph 繪製各種伺服器方面(例如 CPU、記憶體和磁碟使用情況)的圖表也很有幫助,可以讓您更輕鬆地關注趨勢。

相關內容