Перестройка массива Raid

Question

Я согласен с вами, что документация (по крайней мере) неверна.

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: У меня нет системы RHEL. У меня большой опыт работы с Debian raid с разных версий Debian, но я определенно никогда не брал в руки систему RHEL. Пожалуйста, протестируйте это на запасной системе (VM) перед тем, как действовать на производственной машине.

Вот что произойдет:

Удалите диск из RAID-массива.

mdadm --manage /dev/md0 -r /dev/sdc3

Раздел sdc3 будет исключен из массива md0.

Извлеките диск из системы.

Весь диск SDC, включая его раздел SDC3, больше не будет в системе, я предполагаю, что «они» хотят, чтобы мы просто «положили неисправный диск SDC на стол» на данный момент.

С использованиемfdisk, замените извлеченный диск и переформатируйте сменный диск.

Вы подключаетеновыйsdc диск, затем вы переразмечаете его точно так же, как и неисправный. В этот момент в системе снова появится раздел "sdc3"

Добавьте новый диск обратно в RAID-массив.

mdadm --manage /dev/md0 -a /dev/sdc3

Раздел sdc3 будет добавлен в массив,и повторная синхронизация начнется автоматически и немедленно. Это просто то, что нужно для замены вышедшего из строя диска. Вам просто нужно дождаться окончания повторной синхронизации, наблюдая за /proc/mdstat, и ничего больше. Но документация продолжается.

Чтобы восстановить диск, выполните «программный сбой» предыдущего резервного раздела:

mdadm --manage --set-faulty /dev/md0 /dev/sdc3

Это установит раздел sdc3 как неисправный, имитируя аппаратный сбой. Вы вернетесь кдошаг 1, когда у вас произошел сбой раздела sdc3.

Теперь система попытается перестроить массив на замененном диске. Используйте следующую команду для мониторинга статуса:

смотреть -n 1 кот /proc/mdstat

Вообще-то, нет. Система будет ждать вашего вмешательства, и теперь вам следует снова выполнить шаги 1-4. Однако эта команда подходит для мониторинга процесса повторной синхронизации с обновлениями в 1 секунду. Нажмите CTRL+C, чтобы выйти изсмотретьпроцесс.

После завершения восстановления массива извлеките и повторно добавьте в массив диск, на котором произошел программный сбой.

mdadm --manage /dev/md0 -r /dev/sdc3

mdadm --manage /dev/md0 -a /dev/sdc3

На самом деле, эти две команды запустят процесс перестройки (повторной синхронизации). Это в точности шаги 1 и 4 (шаги 2 и 3 сейчас не нужны, так как диск вышел из строя не из-за реальной проблемы, а из-за смоделированной ошибки). Теперь вам нужно дождаться завершения процесса перестроения, отслеживая /proc/mdstat.

Проверьте массив.

mdadm --detail /dev/md0

Это даст вам больше информации о массиве md0, но ничего больше о процессе повторной синхронизации, который вы уже можете получить из /proc/mdstat. Это вообще не нужно.

Answer 1