伺服器運行在 100% 沒有解釋

伺服器運行在 100% 沒有解釋

我有一個 Ubuntu VPS,最近在充分利用處理器的情況下開始無回應。

不幸的是,我不知道是什麼原因導致了這個問題,我正在尋找一些指針,我可以用它們來確定導致問題的原因,以便我可以修復它。

  • 我不知道鎖定時正在運行什麼,但是有什麼方法可以解決這個問題嗎?
  • 我可以採取哪些程序/日誌記錄以便能夠在下次發生問題時診斷問題?

答案1

在我的公司,我們在每台伺服器上都有一個簡單的 cron 腳本來檢查負載平均值。如果平均負載開始攀升超過某個點,它會向我們發送一封電子郵件,以便我們可以登入伺服器並找到有問題的進程。 top將是我輸入的第一個命令。

我相信我們會檢查 5 分鐘的平均負載,但如果您發現伺服器很快就崩潰了,您可能需要腳本來觀察 1 分鐘的平均負載。

相關內容