Linux dmesg 錯誤,主機板問題?

Linux dmesg 錯誤,主機板問題?

在我的系統(16GB RAM、6 核心、RAID0 PCIe SSD)上進行大量磁碟 IO 時,系統停止運作並最終崩潰。正常的日常磁碟 IO 沒有問題,只是長時間的讀取/寫入(例如資料庫重新索引)會出現問題。

一些調查顯示 dmesg 輸出如下:

[...] ata2: exception Emask 0x10 SAct 0x0 SErr 0x90202 action 0xe frozen
[...] ata1: SError: { RecovComm Persist PHYRdyChg 10B8B }
[...] ata1: hard resetting link
[...] ata4: irq_stat 0x00400000, PHY RDY changed

以及連接到系統的各種SATA 設備的大量其他日誌。當進行大量磁碟 IO 時,任何其他輸入都會使系統停止(移動滑鼠等)5-30 秒。

鑑於錯誤出現在多個設備上,並且當從其他設備提供輸入/導致非磁碟中斷時,系統似乎很粗略......我將假設主機板。溫度很好,memcheck 通過。崩潰是完全軟鎖定,而不是核心崩潰或關閉。

這樣看起來合理嗎?我還可以做些什麼來檢查嗎?

編輯:Fedora20,870A-UD3主機板上的家庭伺服器,Intel 910 PCIe SSD + OCZ vertex + Intel X25

Edit2:工作站位於家庭辦公室中,負責處理諸如在 Postgresql 中攪動資料之類的事務。一切都非常無聊,沒有什麼值得再次進行近距離投票的。

答案1

這可能是系統板、佈線或電源問題。如果您的 SATA 硬碟、OCZ 和 Intel X25 連接到主機板,它們可能是罪魁禍首。沒有跡象表明 Intel 910 受到影響。

答案2

SATA 電纜損壞。我已經看到這個錯誤好幾次了。https://bbs.archlinux.org/viewtopic.php?id=129401

相關內容