重新啟動Ubuntu伺服器,沒有恢復。我該如何調查原因?

重新啟動Ubuntu伺服器,沒有恢復。我該如何調查原因?

從上一個問題開始,我從 LinuxDevOps 那裡得到了很好的建議,但我部分選擇了忽略;更糟糕的事情發生了,我不知道為什麼,也不知道該如何調查原因。

我有一台運行 Ubuntu Server 13.10 的專用伺服器。

我有一些核心更新需要重新啟動,所以我把它留了一周,週六晚上 2 點,我現在使用 sudo restart -r 重新啟動。伺服器沒有再恢復。我無法再透過 SSH 連接,也無法透過 HTTP 連接到 Apache。

由於我被鎖在門外,我不得不讓資料中心來救援。他們回來後,他們剛剛重新啟動了伺服器,一切都很好,然後我又回到了線上狀態。

所以現在,我已經學到了慘痛的教訓,LinuxDevOps 在他的答案中粗體顯示的第 1 點是正確的。我認為這是一個不太可能的預防措施,我可以跳過...

我如何調查出了什麼問題?

現在我無法再次重新啟動伺服器,因為我沒有任何跡象表明它不會重複。

謝謝。

Apr  6 02:20:24 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr  6 02:20:34 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr  6 03:38:13 kernel: imklog 5.8.11, log source = /proc/kmsg started.
Apr  6 03:38:13 kernel: [    0.000000] Initializing cgroup subsys cpuset
Apr  6 03:38:13 kernel: [    0.000000] Initializing cgroup subsys cpu
Apr  6 03:38:13 kernel: [    0.000000] Initializing cgroup subsys cpuacct
etc... normal startup

因此,這表明前兩個條目在我看來就像嘗試啟動到特定點,然後一小時後資料中心重新啟動它,這是正常啟動。這是來自 /var/log/kern.log。

謝謝。

答案1

現在您唯一能做的就是查看日誌以獲取可能與您遇到的問題相關的資訊。嗯,就是這樣。

相關內容