Как мне прочитать эту информацию о рейде?

Как мне прочитать эту информацию о рейде?

В настоящее время я работаю на удаленном сервере Ubuntu 18.04, где мне нужно настроить новый массив raid (raid1), а затем смонтировать его как доступный раздел в активной файловой системе. Первым шагом для меня является понимание того, что происходит в данный момент. Я знаю, что внутри активной системы есть 2 жестких диска, которые подключены в массив raid 1. Я использовал команду, lsblkчтобы собрать некоторую информацию. Вывод следующий:

NAME        MAJ:MIN RM   SIZE RO TYPE  MOUNTPOINT
nvme0n1     259:0    0 894,3G  0 disk  
├─nvme0n1p1 259:1    0     4G  0 part  
│ └─md0       9:0    0     4G  0 raid1 [SWAP]
├─nvme0n1p2 259:2    0   512M  0 part  
│ └─md1       9:1    0 511,4M  0 raid1 /boot
└─nvme0n1p3 259:3    0 889,8G  0 part  
  └─md2       9:2    0 889,6G  0 raid1 /

Так значит ли это, что мое физическое устройство называется nvme0n1? И оно разделено на 3 части (swap, boot и /). Если это одно и то же физическое устройство ( nvme0n1), почему разделы ( nvme0n1p1,nvme0n1p2,nvme0n1p3) еще и разделены на md0,md1,md2? В чем разница между nvme0n1p1и md0?

Если я cat /proc/mdstatеще и получу следующий вывод:

md2 : active raid1 nvme0n1p3[1]
      932840768 blocks super 1.2 [2/1] [_U]
      bitmap: 7/7 pages [28KB], 65536KB chunk

md1 : active raid1 nvme0n1p2[1]
      523712 blocks super 1.2 [2/1] [_U]
      
md0 : active raid1 nvme0n1p1[1]
      4190208 blocks super 1.2 [2/1] [_U]

Это показывает 3 активных raidblocks. У меня запущен только один raid-массив. Я не могу интерпретировать вывод... мне нужна помощь.

Спасибо

решение1

Если это полный lsblkвывод, то, боюсь, он показывает только одно физическое устройство хранения данных, nvme0n1.

Ваш nvme0n1раздел разбит на три раздела, каждый из которых индивидуально настроен для зеркалирования программного RAID1. Это дает вам три устройства программного RAID: md0, md1и md2. Каждое из них соответствует одному разделу программного RAID, а не целому диску.

Настройка RAID per-partition таким образом делает диск распознаваемым для BIOS как диск с разделами, даже если BIOS вообще не распознает программный RAID Linux. Это может упростить загрузку и некоторые сценарии восстановления, а также может позволить легко вернуться к конфигурации без RAID, если это необходимо.

В обычном, зеркальном состоянии, md0будет ссылаться на зеркальный набор nvme0n1p1+ nvme1n1p1, md1на набор nvme0n1p2+ nvme1n1p2и т. д. Вы смонтируете файловые системы и активируете подкачку с помощью устройств md0, md1и md2: как только эти устройства будут открыты для использования, подсистема программного RAID заблокирует базовые физические разделы для исключительного доступа, требуя, чтобы весь доступ к разделам проходил через уровень RAID, пока RAID активен.

Однако в каждом из этих программных RAID-наборов отсутствует вторая половина пары RAID1.Это может означать, что система была настроена с программным RAID на двух идентичных устройствах NVMe, но одно из них (вероятно nvme1n1) уже вышло из строя.Или, возможно, система была настроена на одном диске NVMe как на половине набора RAID1, чтобы обеспечить простой переход к настоящему RAID1, как только появится второе устройство NVMe... но этого так и не произошло по той или иной причине.

Вероятно, вашим первым приоритетом должна стать замена неисправного NVMe (или добавление отсутствующего), а затем восстановление существующих пар RAID:

  • скопировать таблицу разделов с существующего диска на новый диск
  • инициализируйте разделы на новом диске как запасные для соответствующего mdNустройства
  • запустите восстановление RAID1 на каждой паре
  • установите вторую копию загрузчика на второй диск, так как MBR и части GRUB находятся за пределами зеркальных разделов.
  • настройте мониторинг RAID-устройств, чтобы отказ одного из физических устройств не остался незамеченным.

Как только это будет сделано, вы сможете подумать о своей первоначальной задаче по настройке нового массива RAID. Для этого вам понадобится больше физического хранилища, поскольку существующее, похоже, nvme0n1полностью занято (и его зеркальный компаньон тоже будет занят, как только текущие полузеркала будут полностью восстановлены).

решение2

Да, вывод показывает только одно физическое устройство (nvme0n1).

Да, вывод показывает, что у него 3 раздела.

Интересная часть - это информация из /proc/mdstat, где показано3настроенные устройства raid, все из которых показывают [_U]. В исправной системе должно быть написано [UU]. 3 устройства raid настроены как raid1 (зеркальные), поэтому (предполагаемый) отказ второго диска пока не привел к потере данных. Конечно, второй диск может быть не обнаружен, поскольку он был удален.

Изучение журнала загрузки может дать вам подсказку, видит ли система вообще второй диск.

nvme0n1p1 — это раздел. В начале у него будет заголовок raid. Остальные сектора в разделе используются как данные для устройства md0. Если подключен второй диск, который может быть обычным spinning rustжестким диском, можно ожидать, что у него будет не менее 3 разделов. Один из них (по соглашению он будет первым, то есть /dev/hda1) также будет иметь заголовок raid, а остальные сектора будут использоваться для хранения второй копии данных для устройства /dev/md0.

Связанный контент