Как диагностировать повторяющуюся проблему с жестким диском в системе FreeNAS?

Как диагностировать повторяющуюся проблему с жестким диском в системе FreeNAS?

Я установил дома сервер FreeNAS (11.2-U8), содержащий 8 дисков, в том числе 2-терабайтные диски Seagate Barracuda ST2000DM006 в конфигурации RAID-Z2.

Остальное аппаратное обеспечение системы выглядит следующим образом:

  • Процессор: Процессор Intel(R) Core(TM) i3-4170 с тактовой частотой 3,70 ГГц
  • Источник питания: EVGA 100-W1-0500-KR
  • Материнская плата: ASRock C226 (с поддержкой ECC)
  • БАРАН: NEMIX RAM 16 ГБ (2 x 8 ГБ) DDR3-1066 МГц PC3-8500 (ECC)

Эта установка проработала 2,5 года без проблем, после чего у меня начали появляться ошибки SATA на жестком диске, подключенном к порту ADA7. Поскольку 2,5 года, по моему мнению, слишком мало, я решил заменить диск на диск «класса NAS», имеющий более длительную гарантию, поэтому я купил WD Red Pro WD2002FFSX.

После успешного переноса данных пула я начал получать те же самые ошибки SATA с этим новым диском всего через несколько дней эксплуатации.

Я начал подозревать кабели, поэтому я поменял местами один конец кабеля SATA от привода на ADA6 и ADA7, подключив проблемный привод к ADA6. Ошибки продолжали отмечаться, но теперь на ADA6; исключая возможность плохого кабеля или даже проблемы с портом материнской платы.

После повторного подключения всего к соответствующим портам я переключил кабели питания ADA6 и ADA7. Ошибки все еще присутствовали на ADA7, что означает, что кабель питания чист.

Учитывая все вышесказанное, каков мой следующий шаг отладки? Я не эксперт в этом вопросе, и похоже, что либо мне очень не повезло и у меня два плохих диска, либо происходит что-то еще, и я понятия не имею, что именно.

Я получаю следующие ошибки:

Device: /dev/ada7, ATA error count increased from 2960 to 2961
Device: /dev/ada7, not capable of SMART self-check
Pool main state is DEGRADED: One or more devices has experienced an unrecoverable error. An attempt was made to correct the error. Applications are unaffected.

Я должен упомянуть, что все жесткие диски поддерживают SMART. Иногда NAS работает без проблем несколько дней, а затем начинает постоянно отправлять мне электронные письма с сообщениями о проблемах. Это действительно спорадическое поведение.

решение1

Я думаю, что это была проблема программного обеспечения. Я не могу точно определить, но запуск всех возможных обновлений на моем NAS (переключение на последний поезд обновлений 11.3 и запуск всех обновлений пула) похоже, сработал.

С тех пор, как я все обновил, все работает уже почти 2 месяца без проблем.

Связанный контент