В пятницу у меня случилась полная катастрофа. Я поехал в дата-центр, чтобы поставить новый сервер, и заодно взял с собой новый диск, чтобы заменить сломавшийся пару недель назад диск в массиве HP P2000 G3 10Gbit iSCSI.
P2000 загружен 12 x 2TB 7.2k MDL SAS дисками и сконфигурирован как 2 массива RAID10, каждый с 4 дисками + 2 горячими резервами. Я уже удалил неисправный диск неделей ранее, его место в массиве автоматически занял один из горячих резервов, как и ожидалось.
Итак, задача была простая замена диска, чтобы вернуть мне горячий резерв. Просто, правда? Вставьте диск, убедитесь, что он виден в графическом интерфейсе, и настройте его как горячий резерв...
Нет...
Я открыл совершенно новый диск из упаковки и вставил его на место, и все диски в массиве мгновенно стали оранжевыми. Я проверил графический интерфейс, и каждый диск показывал «Недопустимые метаданные», быстрая проверка запущенных служб с использованием двух массивов подтвердила, что все потеряли видимость LUN.
Я пересканировал каналы, перезагрузил контроллеры, но все безрезультатно. Диски начали исчезать из GUI, а мои VD (LUN) теперь тоже исчезли из GUI. Я также удалил новый диск, все равно ничего.
В отчаянии и замешательстве я выдернул питание из P2000 и полностью перезагрузил его. Он снова включился, и я снова увидел свои VD... Однако оба массива потеряли всю избыточность, как будто каждая половина из 2 RAID10 потеряла свои зеркальные диски.
Все остальные диски, которые когда-то были частью массива, теперь отображались как доступные. Мне удалось настроить их как горячие резервы, и 2 RAID10 начали реконструкцию. Теперь он снова работает, даже без моего нового диска, так как я слишком боюсь вставлять его снова.
Кто-нибудь знает, что здесь произошло?
Единственное, что я могу придумать, это то, что новый диск, должно быть, содержал собственные метаданные и сбил с толку P2000. Однако это был новый запечатанный диск от нашего обычного поставщика. Однако даже если бы это было так, я бы не ожидал, что массив сделает с этим диском что-то, что повлияет на существующую конфигурацию RAID!
Помоги пожалуйста!
решение1
Всегда есть вероятность, что диск был переработанным. Вы уверены, что ошибка была "недопустимые метаданные" или это было что-то вроде:«Устаревшие метаданные».
Если привод по-прежнему выдает эту ошибку, выберите P2000 в SMU и перейдите к: Tools > Clear Disk Metadata
для конкретного привода.
Дайте мне знать, если сообщение об ошибке было другим.