為什麼這個伺服器崩潰了?

為什麼這個伺服器崩潰了?

我的伺服器崩潰了 3 次(2 次不到 24 小時前),1 週前崩潰過一次。每次,伺服器都無法 ping 通,直到主機重新啟動電腦。我認為它是 ServerPronto 的專用伺服器,具有 4 GB RAM、雙核心或四核心 3.1 GHz,位於佛羅裡達州。足夠的電力來處理負載,還有大量的 CPU 備用。 Innodb緩衝池有足夠的記憶體(1.3GB),可以將整個mysql表儲存在記憶體中,並有額外的空間。 APC 的記憶體也夠了。

我的伺服器上安裝了 New Relic。這3次,我每次都檢查了CPU使用率、記憶體使用率、磁碟空間、網路IO,所有這些都完全穩定。我查看了請求的回應時間,它們都基本上正常。在導致崩潰的一小時內,我的伺服器每分鐘收到 500 個請求:這對我的伺服器來說很正常。然後突然間,在沒有任何峰值的情況下,每分鐘的請求數下降到 0!平均負載為 0.05(非常非常小,但對於我的伺服器來說是正常的),記憶體使用率為 30%,也正常,網路 IO 為 400 KB/秒,也正常。磁碟IO在1-2%,也正常。日誌檔案一定一直在工作,因為我在 apache 日誌檔案中看到了標準警告,但在崩潰之前絕對沒有錯誤。

上次關閉發生在我的流量獲得最少網路流量的時候。

此外,事件發生時沒有執行任何 cron 作業。關閉時的錯誤日誌、PHP/mysql 日誌中沒有錯誤或警告。關閉時沒有向伺服器開啟任何 IDE 或 SSH 連線。

每次故障時,只要重新啟動,一切都會再次正常運作。

我在之前的兩台主機上運行相同的軟體已經 2.5 年了,沒有出現此類問題。另外,我在上個月沒有進行任何程式碼更改(對於當前運行的應用程式)。

大約 1 個月前,當我第一次使用 serverPronto 設定這台機器時,他們在連接我的機器的電纜方面遇到了一些硬體問題:這不是一個好的開始。但他們修復了這個問題,大約 4 週內我沒有遇到任何問題(除了 1 次十分鐘的中斷,不需要重新啟動伺服器)

考慮到所有這些信息,這是否意味著 ServerPronto(我的主機)目前存在硬體問題?或者還有另一種可能性。

答案1

大約 1 個月前,當我第一次使用 serverPronto 設定這台機器時,

壞消息。他們仍然存在硬體問題。就這麼簡單。

如果您安裝了正確的驅動程序,那麼答案很簡單 - 涉及損壞的硬體。

相關內容