DL380 G5, RAID5, ext3, RAID неисправен

DL380 G5, RAID5, ext3, RAID неисправен

У нас есть старый сервер HP DL380G5 с 5 дисками SCSI 3,5'' емкостью 300 ГБ в массиве RAID5 во внешнем отсеке, отформатированный как логический том с файловой системой ext3, на котором размещено 1,2 ТБ конфиденциальных клинических данных пациентов.

Два диска показали прогнозируемый сбой в hpacucli, поэтому я сначала заменил один из них и увидел, что он в порядке, но я не увидел, что он также сообщает "Готов к перестроению". Я совершенно неосторожно заменил и второй, и теперь он сообщает, что RAID ОТКАЗАЛСЯ.

Я вернул старый диск обратно, попытался перезагрузить сервер, но теперь он во время загрузки переводит меня в режим восстановления и сообщает, что не может найти логический том.

Что я могу сделать, чтобы попытаться восстановить это? К сожалению, у нас нет резервной копии. Любая помощь была бы очень признательна!

Я думал о том, чтобы вернуть ОБА старых диска обратно. Есть ли шанс, что это оживит RAID?

решение1

Извините. Но это ошибка оператора.

У вас было два неисправных диска в массиве RAID5, и вы извлекли больше дисков, чем массив мог выдержать.

Делать это без резервного копирования — большая ошибка.

Вам следует обратиться в фирму по восстановлению данных, чтобы попытаться извлечь данные со сломанного логического диска.

решение2

Не включайте систему снова. Выключите ее, позвоните в службу восстановления данных. Существует ряд служб, которые позволяют удаленно восстановить этот тип сбоя. В этот момент все, что вы можете сделать, это ухудшить ситуацию.

Часто это включает в себя подключение всех дисков напрямую к заведомо исправному HBA (не RAID-карте или другому контроллеру!) и запуск определенного загружаемого образа Linux с помощью инструментов удаленного управления. Затем компания удаленно получает доступ к системе, оценивает состояние диска и восстанавливает любые оставшиеся метаданные RAID. Используя фирменное программное обеспечение, они могут повторно собрать виртуальный RAID-диск (техническая деталь: часто что-то, что подключается к стандартной системе сопоставления устройств Linux). Затем это открывает RAID только для чтения в программном обеспечении (без ускорителя RAID SoC). Следующие шаги — проверка того, что данные не повреждены сверх срока использования, и клонирование виртуального диска на новый диск для завершения восстановления данных. После этого вы можете беспокоиться о том, чтобы система снова заработала.

Хотя я не буду называть здесь никаких служб, большинство из них легко найти, а те, которые предлагают удаленные услуги (что избавляет вас от необходимости отправлять им RAID-диски и диск для восстановления туда и обратно, а затем ждать восстановления и клонирования, а затем отправки их обратно), получают преимущество в том, что данные фактически никогда не покидают ваше предприятие.


Небольшая порция хороших новостей: если RAID-контроллер (или вы) не записали никаких новых данных ни на один из дисков, а предварительное предупреждение о сбое не является предупреждением о сбое, то существует практически 99,9999% вероятность того, что хорошая команда по восстановлению данных сможет восстановить все данные, причем достаточно быстро.

решение3

Re: восстановление старых дисков.

Поскольку ваш RAID-массив в его нынешнем виде полностью вышел из строя, вы мало что потеряете, установив два вышедших из строя диска.

Устанавливайте их в оригинальные отсеки.

Помните, что они выходят из строя заранее, а не сразу, поэтому есть большая вероятность, что они проработают достаточно долго, чтобы спасти ваши данные.

Есть вероятность, что RAID просто не загрузится, а также небольшая вероятность, что контроллер попросит «сбросить» RAID (выберите НЕТ/ОТМЕНА), и крошечная вероятность, что RAID-контроллер автоматически сбросит RAID, что сведет на нет любую добавленную стоимость от компании по восстановлению данных.

Так что ваш самый главный приоритет, если возникнет RAID, — это снять данные. Это означает, что должно быть не менее 1,2 ТБ свободного места, готового к копированию данных, и инструмент вроде robocopyили xcopy32или в вашем случае Linux, rsync готовый к запуску. Вы не хотите тратить время на чтение страниц руководства и выяснение синтаксиса, если ваши диски тратят последние минуты.


Как только ваши данные будут в безопасности, воссоздайте RAID как RAID6 с новыми дисками. Вы потеряете 300 ГБ емкости, но получите допуск для двух дисков. Или добавьте дополнительный диск и рассмотрите RAID10 на 6 дисках. Или рассмотрите возможность полного списания этой машины; G5 уже более 10 лет и она больше не подходит для важных производственных задач.

И не пытайтесь вставить ботинок, но также настройте надлежащее решение для резервного копирования. Будет следующий раз.

Связанный контент