
我有一個間歇性重新啟動的 Ubuntu 伺服器。我注意到每三週左右就會重新啟動一次。我有一種感覺,這種情況發生的頻率越來越高,我想準確地了解問題及其發生的頻率。
我正在考慮配置一封在伺服器啟動時發送的電子郵件,但我想在這裡提出問題,看看監視伺服器的最佳實踐是什麼。請注意,您可以使用 Bootmail 或使用 cron 的腳本將伺服器設定為傳送電子郵件。我還注意到了 Nagios,但這似乎更複雜和詳細。監控 Ubuntu 伺服器的最佳實踐是什麼?我正在尋找一些簡單但靈活且功能強大的東西。 shell 腳本越少越好。
答案1
這是 Linux 監控工具清單:(http://www.cyberciti.biz/tips/top-linux-monitoring-tools.html)。如您所見,還有 Nagios。您沒有指定要監控的服務。
如果您需要日誌閱讀器,可以嘗試 Splunk,它對於少量日誌資料是免費的。對於網頁伺服器,我會選擇眾多網路統計程式之一。希望這會有所幫助。對於資料庫,您需要監控可用磁碟空間、表空間大小和 CPU 過載。對於簡單的文件伺服器,我會選擇 mail-ping(cron 作業正在向您的手機發送電子郵件/簡訊。)
監控有很多級別,因此這很大程度上取決於您的伺服器提供的服務、您需要達到的 SLA 以及您可以花費的資金。
答案2
嘗試海獅這是一個免費的Linux監控系統。您只需安裝一個代理程式即可。它可以監視任何自訂命令、shell 腳本、日誌輸出等...當我需要找出 Ubuntu 伺服器上特定時間出了什麼問題時,它對我幫助很大?我可以輕鬆找出當時正在運行哪些進程導致 CPU、記憶體和 I/O 等待時間較長。我推薦這個工具,因為它直覺且易於安裝和設定。