Неверный статус PERC S100

Неверный статус PERC S100

PE T310 с PERC S100, один массив RAID 5 с тремя дисками, статус виртуального диска - «сбой», но он загружается и все работает.

Все диски в Server Administrator находятся в состоянии «В сети» и отмечены зеленой галочкой, но на одном из них нет доступных задач.

Я также видел несогласованность между OMSA и BIOS. Если я загружаюсь в BIOS, один диск имеет статус ready, один статус online, а один статус reserve.

Я обновил драйверы BMC, BIOS и PERC S100 до последних версий, но проблема продолжается.

Это распространенная проблема? Можно ли что-то сделать, чтобы исправить это? Если бы диск действительно вышел из строя, я бы об этом не узнал, поскольку фактически действую вслепую.

решение1

Похоже, что это, скорее всего, простой сбой диска в сочетании с некоторыми проблемами OMSA/контроллера, связанными с отображением правильного состояния.

Проблемный диск, вероятно, тот, который вы видите в состоянии «готов» в BIOS. Это просто означает, что диск все еще функционирует, когда контроллер пытается его инициализировать, но он больше не является активным членом RAID-набора из-за изначально возникшей у него проблемы.

Однако...

...один диск имеет статус «готов», один — статус «в сети», а один — статус «запасной»

Сколько всего жестких дисков на этом контроллере? Если есть только 3, которые вы перечислили, и меню BIOS контроллера сообщает только об 1 из 3 дисков как о здоровом члене RAID5 (что явно неверно, поскольку у вас есть доступ к данным), то мы не можем доверять информации, которую контроллер и OMSA предоставляют нам относительно состояния/здоровья жесткого диска.

Я обновил драйверы BMC, BIOS и PERC S100.

Вы обновили прошивку для PERC S100? Я бы сказал, что это не менее важно, и, вероятно, является причиной замеченных неверных отчетов.

статус виртуального диска - сбой

Это от OMSA или от BIOS контроллера? Было бы хорошо узнать статус VD с обеих сторон.

Обновите прошивку контроллера, если вы этого еще не сделали. В противном случае, возможно, вам больше нечего будет делать, кроме как удалить и заново создать RAID. В этот момент было бы целесообразно обратиться в службу поддержки Dell.

решение2

Стоит отметить, что я заменил диск в этом массиве несколько недель назад (массив был указан как деградировавший, а не как неисправный), проверил, что он начал перестроение, и больше не проверял. Теперь я вижу в журналах, что перестроение не удалось из-за ошибок данных на исходных дисках. Я думаю, если бы мне удалось завершить перестроение, я был бы в хорошей форме.

У S100, похоже, нет прошивки - это программный контроллер? По крайней мере, я не могу найти для него загрузок прошивки. Однако я использую последнюю версию драйвера.

На других контроллерах PERC более высокого уровня мне удалось запустить проверку согласованности массива. Я бы с удовольствием сделал это здесь, а затем перестроил его, но я не вижу такой опции в OMSA на этом контроллере.

Если я не могу завершить перестройку, остается ли у меня единственный выход — заново создать RAID-набор и восстановить его из резервной копии, чтобы восстановить согласованность в OMSA и BIOS контроллера, не говоря уже о самих дисках?

Связанный контент