Ubuntu伺服器自行重啟

Ubuntu伺服器自行重啟

我正在運行 Linode 的 Ubuntu 16.04.3 LTS 盒子,它的使用率很低,但正常運行時間監視器告訴我,我的網站在恢復之前已經關閉了近一個小時。我檢查了一下,發現伺服器重新啟動,此時站點恢復了。收到一封來自 Linode 的電子郵件Host initiated restart。 Linode 內部設定的高使用閾值警報也沒有觸發。

我試著弄清楚發生了什麼事。我在另一個帶有Linode 的Ubuntu 運行箱上看到了一個問題,Linode 支援人員告訴我,有什麼原因導致Linode 崩潰,而Lassie(他們的看門狗)重新啟動了它,這似乎正是這裡發生的情況。

我已經檢查了兩者/var/log/auth.log/var/log/syslog但它們似乎缺少日誌條目,而日誌條目之間18:0318:57停機時間視窗。沒有任何消息本身如此突出。/var/log/messages我的伺服器上沒有日誌。

內容/var/log/syslog

Feb 23 18:03:04 localhost alertyo-engine[6279]: Un-Setting flag
Feb 23 18:03:04 localhost alertyo-engine[6279]: Alloc = 1 MiB#011TotalAlloc = 2470 MiB#011HeapAlloc = 1 MiB#011Sys = 10 MiB#011NumGC = 10856
Feb 23 18:57:14 localhost rsyslogd: [origin software="rsyslogd" swVersion="8.16.0" x-pid="3304" x-info="http://www.rsyslog.com"] start
Feb 23 18:57:14 localhost rsyslogd-2222: command 'KLogPermitNonKernelFacility' is currently not permitted - did you already set it via a RainerScript command (v6+ config)? [v8.16.0 try http://www.rsyslog.com/e/2222 ]
Feb 23 18:57:14 localhost rsyslogd: rsyslogd's groupid changed to 108
Feb 23 18:57:14 localhost rsyslogd: rsyslogd's userid changed to 104
Feb 23 18:57:14 localhost systemd[1]: Mounted FUSE Control File System.

內容/var/log/auth.log

Feb 23 18:03:01 localhost CRON[29814]: pam_unix(cron:session): session closed for user root
Feb 23 18:03:01 localhost CRON[29813]: pam_unix(cron:session): session closed for user ashfame
Feb 23 18:57:14 localhost CRON[3301]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:57:15 localhost systemd-logind[3312]: Watching system buttons on /dev/input/event0 (Power Button)
Feb 23 18:57:15 localhost systemd-logind[3312]: New seat seat0.
Feb 23 18:57:15 localhost sshd[3449]: Server listening on 0.0.0.0 port 22.
Feb 23 18:57:15 localhost sshd[3449]: Server listening on :: port 22.
Feb 23 18:57:16 localhost CRON[3301]: pam_unix(cron:session): session closed for user ashfame
Feb 23 18:58:01 localhost CRON[3681]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb 23 18:58:01 localhost CRON[3680]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:58:01 localhost CRON[3681]: pam_unix(cron:session): session closed for user root
Feb 23 18:59:01 localhost CRON[3787]: pam_unix(cron:session): session opened for user root by (uid=0)
Feb 23 18:59:01 localhost CRON[3786]: pam_unix(cron:session): session opened for user ashfame by (uid=0)
Feb 23 18:59:01 localhost CRON[3787]: pam_unix(cron:session): session closed for user root
Feb 23 18:59:01 localhost CRON[3786]: pam_unix(cron:session): session closed for user ashfame

我還可以檢查什麼?如果這是一個反覆出現的問題,我可能可以設定更多的日誌記錄來找出問題所在,但就像上次一樣(在另一個盒子上),我擔心這是幾個月一次的情況。我如何弄清楚發生了什麼,而不是為它再次發生做好準備?

答案1

剛剛了解到,這是由於 Linode 的 Fermont 資料中心停電造成的。

因此,如果您在伺服器日誌中沒有看到此類問題,原因之一是伺服器剛剛關閉,因此日誌中沒有顯示任何內容(我記得讀過一些系統可以看到的內容)。

檢查提供者的狀態頁面和 Twitter 搜尋總是一個好主意:)

相關內容