我正在嘗試解決其中一台伺服器上的記憶體問題。不久前,我公司正在開發的一個守護程式因分段錯誤而崩潰。一切都還好,但幾秒鐘後其他服務(Nginx、postgress、syslog、ssh)也開始崩潰,也出現分段錯誤。在我看來,這要么是環境/硬體問題,要么是核心/系統庫錯誤。除了長期記憶體測試或遷移到另一個系統之外,我還能做些什麼嗎?
答案1
我不知道這裡到底出了什麼問題,因為該專案被放棄了,但我從中學到的教訓是,當涉及記憶體問題時,你不能相信 OOM Killer 能夠正確完成其工作。
我正在嘗試解決其中一台伺服器上的記憶體問題。不久前,我公司正在開發的一個守護程式因分段錯誤而崩潰。一切都還好,但幾秒鐘後其他服務(Nginx、postgress、syslog、ssh)也開始崩潰,也出現分段錯誤。在我看來,這要么是環境/硬體問題,要么是核心/系統庫錯誤。除了長期記憶體測試或遷移到另一個系統之外,我還能做些什麼嗎?
我不知道這裡到底出了什麼問題,因為該專案被放棄了,但我從中學到的教訓是,當涉及記憶體問題時,你不能相信 OOM Killer 能夠正確完成其工作。