
我的 Debian 系統有問題。今天 04:00 整,它停止回應 nagios。我也無法透過 SSH 登入。這不是第一次發生這種情況,但我第一次用 nagios 看到它。
這個盒子有一個特別的、不尋常的地方:它從 USB 啟動。這就是為什麼我認為將 /var /tmp 映射到 tmpfs 是一個聰明的主意。
我相當確定,如果我重新啟動它,它會再次工作。但由於 /var/log 映射到內存,因此重新啟動後我無法讀取日誌。
下一個問題是硬體不在現場,所以我無法在本地登入。
起初問題可能是 tmpfs 已滿。但nagios在無法連線之前並沒有發出任何警告。我已將警告閾值設為 90% 可用空間。所以這似乎不是這樣的。
其他可能有趣的症狀:
- openVPN 伺服器仍在工作
- 路由仍然有效
- SSH 連接埠仍然打開,並且要求我提供使用者名稱。但如果我提供密碼,連線就會斷開
- 80埠開放,但apache沒有回應
我最感興趣的問題是:debian 系統在凌晨 04:00 可以做什麼?某種更新檢查?
我很感激任何正確方向的想法或指示。有什麼值得用 nagios 監控以獲得提示嗎?下次我會新增監控交換使用情況。
答案1
我們曾經遇到過伺服器記憶體不足的情況。所有正在運行的進程將繼續,但分配新進程可能會失敗。
如果您正在監視記憶體使用情況,這可以回答這個問題。您也可以嘗試遠端登入。
但是,要回答您的問題,請檢查您的 /etc/cron.daily - 這些腳本可能凌晨4點跑步。您也可以檢查/etc/cron.d/和/etc/crontab以查看是否有排程任務。