在 Hetzner 上升級到 Centos Stream 會導致核心崩潰

在 Hetzner 上升級到 Centos Stream 會導致核心崩潰

我有幾台來自Hetzner AX 和EX 系列(AMD 和Intel)的伺服器,我使用Centos 8 安裝這些伺服器,然後遷移到Centos Stream,但每次嘗試使用Stream 中的任何映像啟動時,我都會遇到內核恐慌。
當然,除了聲稱不存在已知問題(HA!)之外,他們對潛在內核配置的建議並沒有多大幫助,以使其工作。因為連日誌都沒有,所以我很無助。
我已經在不同的 PC 上進行了 10 次 Stream 遷移,但只有 HZ 伺服器出現問題。

有人對此有什麼想法嗎?

機器人的截圖

答案1

錯誤發生在amd64_edac_mod模組中。

您可以透過將模組新增至模組黑名單來停用該模組

IE 在/etc/modprobe.d/edac_blacklist.conf

blacklist amd64_edac_mod

然後嘗試重新啟動並查看問題是否再次出現。

這會停用對 ECC 記憶體的機器檢查異常支持,並可能阻止了解是否發生了 ECC 錯誤。

鑑於這種情況發生在多個 Hetzner 主機上,這可能是與主機板或主機板上的記憶體控制單元有關的軟體錯誤。

較新的核心實際上可能會修復它,但我懷疑將模組列入黑名單應該可以防止恐慌。

任何仍然在線且已加載但未死亡的主機,您可能該模組也可以modprobe -r防止出現問題,但我建議先在不重要的主機上進行測試。

相關內容