
При выполнении тяжелого дискового ввода-вывода на моей системе (16 ГБ ОЗУ, 6 ядер, RAID0 PCIe SSD) система зависает и в конечном итоге падает. Обычный повседневный дисковый ввод-вывод в порядке, только длительное чтение/запись, например, переиндексация базы данных, являются проблемными.
В ходе некоторых исследований были выявлены следующие выходные данные dmesg:
[...] ata2: exception Emask 0x10 SAct 0x0 SErr 0x90202 action 0xe frozen
[...] ata1: SError: { RecovComm Persist PHYRdyChg 10B8B }
[...] ata1: hard resetting link
[...] ata4: irq_stat 0x00400000, PHY RDY changed
И тонны других журналов для различных устройств sata, подключенных к системе. При выполнении тяжелого дискового ввода-вывода любой другой ввод останавливает систему (перемещение мыши и т. д.) на 5-30 секунд.
Учитывая, что ошибки есть на нескольких устройствах, и система выглядит неустойчивой при вводе данных с других устройств/вызывая недисковые прерывания... я предполагаю, что это материнская плата. Температуры в порядке, проверка памяти проходит. Сбой — это полная мягкая блокировка, а не сбой ядра или отключение.
Кажется ли это разумным? Что еще я могу сделать, чтобы проверить?
Редактировать: Fedora20, домашний сервер на плате 870A-UD3, Intel 910 pcie SSD + OCZ vertex + Intel X25
Edit2: Рабочая станция находится в домашнем офисе, занимаясь офисными делами, такими как перемешивание данных в Postgresql. Все очень скучно, ничего, что могло бы оправдать еще одно закрытое голосование.
решение1
Вероятно, проблема в системной плате, кабелях или блоке питания. Если ваши диски SATA, OCZ и Intel X25, подключены к материнской плате, они, вероятно, виновники. Нет никаких признаков того, что Intel 910 затронут.
решение2
Плохой кабель sata. Я видел эту ошибку несколько раз.https://bbs.archlinux.org/viewtopic.php?id=129401