
Здравствуйте, я хочу перестроить свой RAID-массив и нашел страницу в документации RedHat, где говорится, как это сделать, но, похоже, это не имеет смысла.
Вот ссылка на документациюМеня смущает шаг 5:
" Чтобы восстановить диск, выполните "программный сбой" предыдущего запасного слайса: mdadm --manage --set-faulty /dev/md0 /dev/sdc3 ". Теперь система попытается перестроить массив на замененном диске.
Это не только не имеет никакого смысла на английском языке, но я еще и не понимаю, как mdadm автоматически перестроит массив сразу после того, как я только что установил отказ одного из дисков. Это просто ошибка в документации? Пожалуйста, помогите, я запутался. Может кто-нибудь сказать мне, правильны ли эти инструкции, прежде чем я что-нибудь испорчу? Спасибо.
решение1
Я согласен с вами, что документация (по крайней мере) неверна.
ОТКАЗ ОТ ОТВЕТСТВЕННОСТИ: У меня нет системы RHEL. У меня большой опыт работы с Debian raid с разных версий Debian, но я определенно никогда не брал в руки систему RHEL. Пожалуйста, протестируйте это на запасной системе (VM) перед тем, как действовать на производственной машине.
Вот что произойдет:
Удалите диск из RAID-массива.
mdadm --manage /dev/md0 -r /dev/sdc3
Раздел sdc3 будет исключен из массива md0.
- Извлеките диск из системы.
Весь диск SDC, включая его раздел SDC3, больше не будет в системе, я предполагаю, что «они» хотят, чтобы мы просто «положили неисправный диск SDC на стол» на данный момент.
- С использованиемfdisk, замените извлеченный диск и переформатируйте сменный диск.
Вы подключаетеновыйsdc диск, затем вы переразмечаете его точно так же, как и неисправный. В этот момент в системе снова появится раздел "sdc3"
Добавьте новый диск обратно в RAID-массив.
mdadm --manage /dev/md0 -a /dev/sdc3
Раздел sdc3 будет добавлен в массив,и повторная синхронизация начнется автоматически и немедленно. Это просто то, что нужно для замены вышедшего из строя диска. Вам просто нужно дождаться окончания повторной синхронизации, наблюдая за /proc/mdstat, и ничего больше. Но документация продолжается.
Чтобы восстановить диск, выполните «программный сбой» предыдущего резервного раздела:
mdadm --manage --set-faulty /dev/md0 /dev/sdc3
Это установит раздел sdc3 как неисправный, имитируя аппаратный сбой. Вы вернетесь кдошаг 1, когда у вас произошел сбой раздела sdc3.
Теперь система попытается перестроить массив на замененном диске. Используйте следующую команду для мониторинга статуса:
смотреть -n 1 кот /proc/mdstat
Вообще-то, нет. Система будет ждать вашего вмешательства, и теперь вам следует снова выполнить шаги 1-4. Однако эта команда подходит для мониторинга процесса повторной синхронизации с обновлениями в 1 секунду. Нажмите CTRL+C, чтобы выйти изсмотретьпроцесс.
После завершения восстановления массива извлеките и повторно добавьте в массив диск, на котором произошел программный сбой.
mdadm --manage /dev/md0 -r /dev/sdc3
mdadm --manage /dev/md0 -a /dev/sdc3
На самом деле, эти две команды запустят процесс перестройки (повторной синхронизации). Это в точности шаги 1 и 4 (шаги 2 и 3 сейчас не нужны, так как диск вышел из строя не из-за реальной проблемы, а из-за смоделированной ошибки). Теперь вам нужно дождаться завершения процесса перестроения, отслеживая /proc/mdstat.
Проверьте массив.
mdadm --detail /dev/md0
Это даст вам больше информации о массиве md0, но ничего больше о процессе повторной синхронизации, который вы уже можете получить из /proc/mdstat. Это вообще не нужно.