три диска с ошибками ECC на 3ware raid за две недели

три диска с ошибками ECC на 3ware raid за две недели

У меня есть сервер, который я обслуживаю для клиента. Это компьютер на базе Intel Nehalem, так что он не новый, но в рабочем состоянии. На нем установлена ​​карта 3ware 9650SE-24M8 с 20 подключенными дисками и 4 пустыми слотами, сконфигурированными в 5 массивов raid5. Три из этих массивов состоят из дисков по 2 ТБ, два других — по 3 ТБ. За последние две недели мы потеряли 3 диска по 3 ТБ из одного массива, два в один и тот же день. Мы делаем ночные резервные копии, поэтому потери данных нет, но простой обходится дорого, как и замена дисков. Под потерей я подразумеваю, что карта сообщает об ошибке ECC. Диски по 2 ТБ приближаются к 25000 часов работы, диски по 3 ТБ приближаются к 10000 часов работы.

Температура окружающей среды составляет около 25°C, а диски (согласно smart) в режиме ожидания находятся на отметке 28-30°C. Операционная система — Fedora Linux 13 amd64 (я пытаюсь обновиться уже полгода, но не могу добиться достаточно стабильной работы, чтобы чувствовать себя готовым к этому).

Я не знаю, что делать в этой ситуации. До этого момента у меня два диска вышли из строя, оба по 1 ТБ и довольно старые, с разницей в несколько месяцев. Помогите или посоветуйте что-нибудь?

Связанный контент