В сервере HP с windows 2008-R2. Есть PCI Silicon Image SATA raid контроллер с 4 дисками SATA. В контроллере есть конфигурация для объединения их в конфигурацию Raid5. Windows видит их как 1 диск.
При перезагрузке сервера сегодня утром один из дисков "прыгал" (механически). После шума экран показывал, что один из дисков в рейде отсутствует. (это был неверный вывод)
При перезагрузке оборудования, на этот раз с открытым капотом, "отсутствующий" диск - единственный с механической вибрацией. (причина неправильного вывода). При продолжении запуска система показывает 4 устройства, но нет тома raid.
Я боялся, что прыгающий диск «удерживает» подключение тома raid. SATA — это горячая замена, поэтому я снял «errordisk» с raidcontroller. Напрямую, программное обеспечение создает событие «устройство отсутствует». Логично. Я снова подключаю его. Когда я подключаюсь, я вижу, что отключил не тот диск. Не errordisk, а исправный. Я повторяю процесс для errordisk. В этот момент я снова слышу звук и следую своим ушам. «Прыжок» исходит от запасного диска в массиве HP. Узнаю о неправильном выводе
Когда я перезапускаю систему, снова нет тома raid. Я захожу в контроллер "bios". Там возможности ограничены. Я вижу 4 работающих устройства и конфигурацию набора raid5 на 4 дисках. Возвращаюсь в Windows, запускаю программное обеспечение. Там я вижу, что 1 диск активен, но больше не является частью raid5. У остальных есть существующий набор raid. (см. рисунок) Система сообщает мне, что все 4 диска исправны. Система сообщает мне, что есть набор raid5 на 3 дисках. Но кнопка перестройки серая. Когда я пробую: "конвертировать устаревшую группу raid", я получаю ошибку.
Что я могу сделать, чтобы восстановить том и не потерять данные?
Обновление 1: существующая резервная копия недостаточно свежая и неполная. Данные можно взять из других мест, но реконструкция займет много времени и будет неполной. Обновление сервера до новой версии — это продолжающиеся разговоры, и этот шаг имеет последствия для людей, использующих сервер на разных уровнях. Они знают, что им это нужно, но они откладывают.
решение1
Проверьте серийный номер неисправного диска, о котором контроллер сообщил, что он неисправен, и проверьте, выключен ли сервер, прежде чем перезапускать сервер.
При перезапуске оборудования, на этот раз с открытым капотом, "отсутствующий" диск - единственный с механической вибрацией. (причина неправильного вывода). При продолжении запуска,система показывает 4 устройства, но нет тома рейда.
Все шаги, которые вы предприняли для восстановления после выделенного жирным шрифтом текста, к сожалению, бесполезны, поскольку при первой перезагрузке RAID-массив, похоже, был стерт с контроллера.
Помните, что диск может тикать и издавать шум при нормальном использовании. Это не главный фактор для обнаружения неисправного диска. В следующий раз, если контроллер сообщит, что диск с серийным номером X вышел из строя, используйте это как способ его найти. Если диск рядом с ним издает звук содрогания, вы можете предположить, что ваш массив тоже может вскоре выйти из строя, особенно в конфигурации raid5, где у вас может быть только один участник в автономном режиме. К сожалению, звук содрогания является предупреждением о том, что у вас есть резервная копия поблизости.
Мой совет — восстановить данные из резервной копии и, по возможности, избавиться от неисправного контроллера, а пока обновиться до поддерживаемой ОС.