診斷伺服器宕機的原因

診斷伺服器宕機的原因

我有幾個運行 Windows Server 2008 R2 VPS 的 Asp.Net Web 應用程式。我們已經使用這個 VPS 多年了。自過去幾個月以來,我們的應用程式出現了 30-45 分鐘宕機的情況。這不會定期發生,也不會在一天的同一時間發生。在過去的兩個月裡,這種情況肯定發生過四、五次。我們的分析不會報告大量同時在線的用戶。我們有更多的線上用戶,並且沒有出現任何問題。

在停機期間,我們無法透過 RDP 存取 VPS。新的遺跡監測顯示任何方面的活動都為零。 VPS恢復上線後,應用程式可以正常運作。即使 VPS 重新上線後,nwe relic 也不會顯示該時間段內的任何新條目。事件檢視器在停機期間也沒有顯示任何條目。我們在系統/安全/應用程式日誌中擁有常見的條目,幾乎每分鐘一個,直到停機開始。下一個條目將在停機時間結束後開始。

看起來,在這段時間內,我們的 VPS 幾乎處於休眠狀態。我已在事件檢視器中檢查了 id 為 6005,6008,6009,6013,1072,1074,1076 的事件。我在各種網路貼文中讀到,這些事件 ID 可以幫助識別計劃/意外的關閉/重啟。我沒有找到這個時間範圍內的任何內容。

我還能做些什麼來確定為什麼會發生這種情況並防止它發生。

編輯

本次停機是由於主機重新啟動實體伺服器所造成的。對於先前的停機事件,主機聲稱沒有參與其中。讓我們來看看。我目前將 @Greg 的帖子標記為已接受的答案,因為這是我到目前為止還沒有考慮過做的事情。

答案1

你還能做什麼?以一分鐘的間隔啟用 ASP.Net 運作狀況監控/心跳。如果沒有心跳,很可能是 Windows/IIS/ASP.Net 外部的問題。

看起來更有可能是您的服務提供者導致了中斷,而不是作業系統缺陷,如果在多個主機/網路上使用多個伺服器,作業系統缺陷很可能會產生零影響。

如果您沒有任何指標、測量或可用性協議,您將不太可能嘗試透過讓客戶端作業系統解決 VPS 提供者主機或網路的問題來逆向工程答案。

不幸的是,將應用程式移至「雲端」無法修復損壞或功能失調的架構或承包技能。

答案2

請聯絡您的 vps 提供者。可能是硬體故障、網路問題或任何其他問題。遠端連線遺失表示問題出在您的應用程式之外,並且可能在作業系統之外。您的供應商應該能夠幫助您診斷問題......如果沒有,我認為您仍然會知道如何解決可靠性問題。

相關內容