Перестройка массива Raid

Перестройка массива Raid

Здравствуйте, я хочу перестроить свой RAID-массив и нашел страницу в документации RedHat, где говорится, как это сделать, но, похоже, это не имеет смысла.

Вот ссылка на документациюМеня смущает шаг 5:

" Чтобы восстановить диск, выполните "программный сбой" предыдущего запасного слайса: mdadm --manage --set-faulty /dev/md0 /dev/sdc3 ". Теперь система попытается перестроить массив на замененном диске.

Это не только не имеет никакого смысла на английском языке, но я еще и не понимаю, как mdadm автоматически перестроит массив сразу после того, как я только что установил отказ одного из дисков. Это просто ошибка в документации? Пожалуйста, помогите, я запутался. Может кто-нибудь сказать мне, правильны ли эти инструкции, прежде чем я что-нибудь испорчу? Спасибо.

решение1

Я согласен с вами, что документация (по крайней мере) неверна.

ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: У меня нет системы RHEL. У меня большой опыт работы с Debian raid с разных версий Debian, но я определенно никогда не брал в руки систему RHEL. Пожалуйста, протестируйте это на запасной системе (VM) перед тем, как действовать на производственной машине.

Вот что произойдет:

  1. Удалите диск из RAID-массива.

    mdadm --manage /dev/md0 -r /dev/sdc3

Раздел sdc3 будет исключен из массива md0.

  1. Извлеките диск из системы.

Весь диск SDC, включая его раздел SDC3, больше не будет в системе, я предполагаю, что «они» хотят, чтобы мы просто «положили неисправный диск SDC на стол» на данный момент.

  1. С использованиемfdisk, замените извлеченный диск и переформатируйте сменный диск.

Вы подключаетеновыйsdc диск, затем вы переразмечаете его точно так же, как и неисправный. В этот момент в системе снова появится раздел "sdc3"

  1. Добавьте новый диск обратно в RAID-массив.

    mdadm --manage /dev/md0 -a /dev/sdc3

Раздел sdc3 будет добавлен в массив,и повторная синхронизация начнется автоматически и немедленно. Это просто то, что нужно для замены вышедшего из строя диска. Вам просто нужно дождаться окончания повторной синхронизации, наблюдая за /proc/mdstat, и ничего больше. Но документация продолжается.

  1. Чтобы восстановить диск, выполните «программный сбой» предыдущего резервного раздела:

    mdadm --manage --set-faulty /dev/md0 /dev/sdc3

Это установит раздел sdc3 как неисправный, имитируя аппаратный сбой. Вы вернетесь кдошаг 1, когда у вас произошел сбой раздела sdc3.

  1. Теперь система попытается перестроить массив на замененном диске. Используйте следующую команду для мониторинга статуса:

    смотреть -n 1 кот /proc/mdstat

Вообще-то, нет. Система будет ждать вашего вмешательства, и теперь вам следует снова выполнить шаги 1-4. Однако эта команда подходит для мониторинга процесса повторной синхронизации с обновлениями в 1 секунду. Нажмите CTRL+C, чтобы выйти изсмотретьпроцесс.

  1. После завершения восстановления массива извлеките и повторно добавьте в массив диск, на котором произошел программный сбой.

    mdadm --manage /dev/md0 -r /dev/sdc3

    mdadm --manage /dev/md0 -a /dev/sdc3

На самом деле, эти две команды запустят процесс перестройки (повторной синхронизации). Это в точности шаги 1 и 4 (шаги 2 и 3 сейчас не нужны, так как диск вышел из строя не из-за реальной проблемы, а из-за смоделированной ошибки). Теперь вам нужно дождаться завершения процесса перестроения, отслеживая /proc/mdstat.

  1. Проверьте массив.

    mdadm --detail /dev/md0

Это даст вам больше информации о массиве md0, но ничего больше о процессе повторной синхронизации, который вы уже можете получить из /proc/mdstat. Это вообще не нужно.

Связанный контент