В настоящее время я работаю на удаленном сервере Ubuntu 18.04, где мне нужно настроить новый массив raid (raid1), а затем смонтировать его как доступный раздел в активной файловой системе. Первым шагом для меня является понимание того, что происходит в данный момент. Я знаю, что внутри активной системы есть 2 жестких диска, которые подключены в массив raid 1. Я использовал команду, lsblk
чтобы собрать некоторую информацию. Вывод следующий:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
nvme0n1 259:0 0 894,3G 0 disk
├─nvme0n1p1 259:1 0 4G 0 part
│ └─md0 9:0 0 4G 0 raid1 [SWAP]
├─nvme0n1p2 259:2 0 512M 0 part
│ └─md1 9:1 0 511,4M 0 raid1 /boot
└─nvme0n1p3 259:3 0 889,8G 0 part
└─md2 9:2 0 889,6G 0 raid1 /
Так значит ли это, что мое физическое устройство называется nvme0n1
? И оно разделено на 3 части (swap, boot и /). Если это одно и то же физическое устройство ( nvme0n1
), почему разделы ( nvme0n1p1,nvme0n1p2,nvme0n1p3
) еще и разделены на md0,md1,md2
? В чем разница между nvme0n1p1
и md0
?
Если я cat /proc/mdstat
еще и получу следующий вывод:
md2 : active raid1 nvme0n1p3[1]
932840768 blocks super 1.2 [2/1] [_U]
bitmap: 7/7 pages [28KB], 65536KB chunk
md1 : active raid1 nvme0n1p2[1]
523712 blocks super 1.2 [2/1] [_U]
md0 : active raid1 nvme0n1p1[1]
4190208 blocks super 1.2 [2/1] [_U]
Это показывает 3 активных raidblocks. У меня запущен только один raid-массив. Я не могу интерпретировать вывод... мне нужна помощь.
Спасибо
решение1
Если это полный lsblk
вывод, то, боюсь, он показывает только одно физическое устройство хранения данных, nvme0n1
.
Ваш nvme0n1
раздел разбит на три раздела, каждый из которых индивидуально настроен для зеркалирования программного RAID1. Это дает вам три устройства программного RAID: md0
, md1
и md2
. Каждое из них соответствует одному разделу программного RAID, а не целому диску.
Настройка RAID per-partition таким образом делает диск распознаваемым для BIOS как диск с разделами, даже если BIOS вообще не распознает программный RAID Linux. Это может упростить загрузку и некоторые сценарии восстановления, а также может позволить легко вернуться к конфигурации без RAID, если это необходимо.
В обычном, зеркальном состоянии, md0
будет ссылаться на зеркальный набор nvme0n1p1
+ nvme1n1p1
, md1
на набор nvme0n1p2
+ nvme1n1p2
и т. д. Вы смонтируете файловые системы и активируете подкачку с помощью устройств md0
, md1
и md2
: как только эти устройства будут открыты для использования, подсистема программного RAID заблокирует базовые физические разделы для исключительного доступа, требуя, чтобы весь доступ к разделам проходил через уровень RAID, пока RAID активен.
Однако в каждом из этих программных RAID-наборов отсутствует вторая половина пары RAID1.Это может означать, что система была настроена с программным RAID на двух идентичных устройствах NVMe, но одно из них (вероятно nvme1n1
) уже вышло из строя.Или, возможно, система была настроена на одном диске NVMe как на половине набора RAID1, чтобы обеспечить простой переход к настоящему RAID1, как только появится второе устройство NVMe... но этого так и не произошло по той или иной причине.
Вероятно, вашим первым приоритетом должна стать замена неисправного NVMe (или добавление отсутствующего), а затем восстановление существующих пар RAID:
- скопировать таблицу разделов с существующего диска на новый диск
- инициализируйте разделы на новом диске как запасные для соответствующего
mdN
устройства - запустите восстановление RAID1 на каждой паре
- установите вторую копию загрузчика на второй диск, так как MBR и части GRUB находятся за пределами зеркальных разделов.
- настройте мониторинг RAID-устройств, чтобы отказ одного из физических устройств не остался незамеченным.
Как только это будет сделано, вы сможете подумать о своей первоначальной задаче по настройке нового массива RAID. Для этого вам понадобится больше физического хранилища, поскольку существующее, похоже, nvme0n1
полностью занято (и его зеркальный компаньон тоже будет занят, как только текущие полузеркала будут полностью восстановлены).
решение2
Да, вывод показывает только одно физическое устройство (nvme0n1).
Да, вывод показывает, что у него 3 раздела.
Интересная часть - это информация из /proc/mdstat
, где показано3настроенные устройства raid, все из которых показывают [_U]
. В исправной системе должно быть написано [UU]
. 3 устройства raid настроены как raid1 (зеркальные), поэтому (предполагаемый) отказ второго диска пока не привел к потере данных. Конечно, второй диск может быть не обнаружен, поскольку он был удален.
Изучение журнала загрузки может дать вам подсказку, видит ли система вообще второй диск.
nvme0n1p1 — это раздел. В начале у него будет заголовок raid. Остальные сектора в разделе используются как данные для устройства md0. Если подключен второй диск, который может быть обычным spinning rust
жестким диском, можно ожидать, что у него будет не менее 3 разделов. Один из них (по соглашению он будет первым, то есть /dev/hda1) также будет иметь заголовок raid, а остальные сектора будут использоваться для хранения второй копии данных для устройства /dev/md0.