Массив FakeRAID выходит из строя. Почему?

Массив FakeRAID выходит из строя. Почему?

У нас есть система Windows XP с материнской платой AMD (GA-890GPA-UD3H), и мы используем встроенную возможность RAID. Система настроена в RAID 1 (с помощью инструмента AMD RAIDXpert). Она состоит из двух жестких дисков Samsung HD502IJ по 500 ГБ.

Проблема в том, что массив часто выходит из строя. Сообщение об ошибке: Logical drive goes critical.Следовательно, диски больше не зеркалируются.

Я могу пересобрать диски, но это не сильно помогает. Ошибка повторяется нерегулярно/хаотично. Иногда она выходит из строя через 3 дня, иногда через 7 дней, так что она нестабильна.

В чем проблема и как это доказать? Я могу получить информацию SMART по дискам, и по отдельности они в порядке.

решение1

Та же проблема была с жесткими дисками потребительского класса (WD и Hitachi), установленными в различных NAS (с аппаратным RAID).

После множества экспериментов я обнаружил, что моя проблема была связана с различными способами обработки задержек чтения и тайм-аутов дисками.

Мне пришлось включить TLER/CCTL в прошивке дисков. С тех пор массивы работали безупречно.

Смотрите такжеhttp://en.wikipedia.org/wiki/Error_recovery_control

решение2

У меня было много проблем с дисками Samsung и чипсетом AMD (в HP Microserver). По-моему, это чипсет 780G.

Я использую Linux, и при высокой пропускной способности на дисках я получаю сообщения в журнале, жалующиеся на то, что контроллер не ответил вовремя и был сброшен. В конечном итоге это привело к повреждению массива. Отключение AHCI и переход на SATA1 немного помогло, но не полностью устранило проблему.

У моего друга с таким же оборудованием была та же проблема на Windows Home Server, хотя я не помню, что было написано в журналах.

Видите ли вы что-нибудь в eventvwr о дисках?

Связанный контент