對 Amazon EC2 上的神秘伺服器凍結進行故障排除

Question 1

您應該做的第一件事是設定一些監控，以便讓您知道伺服器何時變得無回應。您可以透過使用 pingdom 和/或 cloudwatch 檢查服務正常運作時間和系統統計資料（例如 cpu 和 ram）來完成此操作。兩者都有針對小型帳戶的免費方案。這將使您能夠在故障發生時了解情況，並且可以更輕鬆地找到日誌以了解當時發生的情況。通常這樣的事情可能是由於系統沒有足夠的資源引起的，你沒有提到你的實例的大小，但像微機這樣的東西可能只是透過一個簡單的cron 作業來佔用100% 的cpu，此時伺服器就會鎖定。

還要檢查系統日誌旁邊的其他日誌，檢查所有應用程式日誌，看看其中是否有任何日誌在系統崩潰之前拋出錯誤。

Answer

您應該做的第一件事是設定一些監控，以便讓您知道伺服器何時變得無回應。您可以透過使用 pingdom 和/或 cloudwatch 檢查服務正常運作時間和系統統計資料（例如 cpu 和 ram）來完成此操作。兩者都有針對小型帳戶的免費方案。這將使您能夠在故障發生時了解情況，並且可以更輕鬆地找到日誌以了解當時發生的情況。通常這樣的事情可能是由於系統沒有足夠的資源引起的，你沒有提到你的實例的大小，但像微機這樣的東西可能只是透過一個簡單的cron 作業來佔用100% 的cpu，此時伺服器就會鎖定。

還要檢查系統日誌旁邊的其他日誌，檢查所有應用程式日誌，看看其中是否有任何日誌在系統崩潰之前拋出錯誤。

Question 2

可能是主機上的網路卡損壞。

Answer

可能是主機上的網路卡損壞。

對 Amazon EC2 上的神秘伺服器凍結進行故障排除

答案1

答案2

相關內容