mdadm RAID は LVM の基盤として機能し、再起動後に消えてしまいます。

Question 1

Martin L. ソリューションの別のバリエーションを紹介したいと思います。このソリューションは、システムが動作している間に新しいアレイへのデータ移行を透過的に実行できるため、ダウンタイムが大幅に短縮されるという点で異なります。移行中はディスクパフォーマンスが低下するだけです。

提案通りにしてください彼の答えの中で新しいVGを作成することを提案するところまで。

新しい VG を作成しないでください。新しく作成したアレイに新しい PV を作成し、これらの PV を使用して既存の VG を拡張しますvgextend fg00 /dev/md-NEW。

次に、を使用して、論理ボリュームを古い pv から新しい pv に移動しますpvmove /dev/md-OLD。これは、ファイルシステムがマウントされ、アクセスされている間でも実行できます。これには長い時間がかかりますが、最終的には終了します。私はこれを内で実行し、をscreen冗長的に実行します。SSHscreen pvmove -vi5 /dev/md-OLDセッションが閉じられて 5 秒ごとに進行状況が表示されても中断されないようにします。

新しい PV にこれを行うのに十分な PE がない場合があります。これは、ドライブ全体ではなくパーティションを使用するため、使用可能なスペースとアレイサイズがわずかに小さくなるためです。その場合は、LV を 1 つ減らす必要があります。たとえば、FS をアンマウントし、を ( を使用resize2fs) して LV サイズを減らします。これには時間がかかりますが、ビジーなファイルシステムをファイルごとにコピーするよりは高速です。

古い PV が空になったら (pvmove が完了)、それらを VG から削除し、PV ラベルを削除して、古いアレイを削除します。現在使用されていないドライブを消去し、パーティション分割して、実行中のアレイに追加します。アレイの再同期もバックグラウンドで実行され、完了するまでディスクパフォーマンスが低下するだけです。

mdadam --examine --scan >> /etc/mdadm/mdadm.confここで、ブート、つまり、update-initramfsなどの修正を忘れないでください。

Answer

Martin L. ソリューションの別のバリエーションを紹介したいと思います。このソリューションは、システムが動作している間に新しいアレイへのデータ移行を透過的に実行できるため、ダウンタイムが大幅に短縮されるという点で異なります。移行中はディスクパフォーマンスが低下するだけです。

提案通りにしてください彼の答えの中で新しいVGを作成することを提案するところまで。

新しい VG を作成しないでください。新しく作成したアレイに新しい PV を作成し、これらの PV を使用して既存の VG を拡張しますvgextend fg00 /dev/md-NEW。

次に、を使用して、論理ボリュームを古い pv から新しい pv に移動しますpvmove /dev/md-OLD。これは、ファイルシステムがマウントされ、アクセスされている間でも実行できます。これには長い時間がかかりますが、最終的には終了します。私はこれを内で実行し、をscreen冗長的に実行します。SSHscreen pvmove -vi5 /dev/md-OLDセッションが閉じられて 5 秒ごとに進行状況が表示されても中断されないようにします。

新しい PV にこれを行うのに十分な PE がない場合があります。これは、ドライブ全体ではなくパーティションを使用するため、使用可能なスペースとアレイサイズがわずかに小さくなるためです。その場合は、LV を 1 つ減らす必要があります。たとえば、FS をアンマウントし、を ( を使用resize2fs) して LV サイズを減らします。これには時間がかかりますが、ビジーなファイルシステムをファイルごとにコピーするよりは高速です。

古い PV が空になったら (pvmove が完了)、それらを VG から削除し、PV ラベルを削除して、古いアレイを削除します。現在使用されていないドライブを消去し、パーティション分割して、実行中のアレイに追加します。アレイの再同期もバックグラウンドで実行され、完了するまでディスクパフォーマンスが低下するだけです。

mdadam --examine --scan >> /etc/mdadm/mdadm.confここで、ブート、つまり、update-initramfsなどの修正を忘れないでください。

Question 2

@nh2は簡単な答えだが危険かもしれない彼の答えの解決策パーティションを使用してmdadmアレイを作成する場合とディスク全体を直接使用する場合の違いは何ですか

ちなみに、このような事態が起こっても、データは失われません。おそらくsgdisk --zapデバイスだけを削除して、たとえばmdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sdc /dev/sdd(mdadm は過去のデータをすでに検出したことを通知し、そのデータを引き続き再利用するかどうかを尋ねます) を使用して RAID を再作成できます。私はこれを複数回試しましたが、うまくいきましたが、実行する前にバックアップを取ることをお勧めします。

長い調査の末、なんとか解決策を見つけることができました。

私がやったことはこれです

まずステータス情報

PROMPT> df -h
Dateisystem           Größe Benutzt Verf. Verw% Eingehängt auf
/dev/mapper/fg00-Data  5,4T    1,5T  3,8T   28% /data

次にパーティションをアンマウントします

PROMPT> umount /data

PROMPT> cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sdg[1] sdf[0]
      1953382464 blocks super 1.2 [2/2] [UU]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md0 : active raid1 sde[1] sda[0]
      3906886464 blocks super 1.2 [2/2] [UU]
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>

2つのアレイを分解します

PROMPT > mdadm --manage /dev/md0 --fail /dev/sde
mdadm: set /dev/sde faulty in /dev/md0

PROMPT > mdadm --manage /dev/md1 --fail /dev/sdg
mdadm: set /dev/sdg faulty in /dev/md1

PROMPT > cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sdg[1](F) sdf[0]
      1953382464 blocks super 1.2 [2/1] [U_]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md0 : active raid1 sde[1](F) sda[0]
      3906886464 blocks super 1.2 [2/1] [U_]
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>

アレイからディスクを取り外す

PROMPT > mdadm --manage /dev/md0 --remove /dev/sde 
mdadm: hot removed /dev/sde from /dev/md0
PROMPT > mdadm --manage /dev/md1 --remove /dev/sdg
mdadm: hot removed /dev/sdg from /dev/md1

PROMPT > cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sdf[0]
      1953382464 blocks super 1.2 [2/1] [U_]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md0 : active raid1 sda[0]
      3906886464 blocks super 1.2 [2/1] [U_]
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>

現在/dev/sde、とは/dev/sdg自由に (再) パーティション化できます。

/dev/sdeそこで、/dev/sdg提案されたとおり、使用可能なスペースよりも数 MB 小さい新しいパーティションを作成しました。
1 つのアクティブディスクと 1 つの「欠落」ディスクを持つ新しい 2 ディスク RAID1 アレイを作成しました。
新しいアレイを物理ボリュームとして新しいLVMボリュームグループを構築しました
その上に論理ボリュームを作成しました（パーティション作成時に失われた数MBを除いた、古いものと同じサイズ）
古いLVから新しいLVにすべてのデータをコピーしました
古いRAIDを破壊し、~~ディスクの~~パーティションを新しいものに追加しました

これが新しい状況です

PROMPT > lsblk -o NAME,SIZE,FSTYPE,TYPE,MOUNTPOINT
NAME              SIZE FSTYPE            TYPE  MOUNTPOINT
sda               3,7T                   disk  
└─sda1            3,7T linux_raid_member part  
  └─md2           3,7T LVM2_member       raid1 
    └─fg01-Data   5,5T ext4              lvm   /data
sde               3,7T                   disk  
└─sde1            3,7T linux_raid_member part  
  └─md2           3,7T LVM2_member       raid1 
    └─fg01-Data   5,5T ext4              lvm   /data
sdf               1,8T                   disk  
└─sdf1            1,8T linux_raid_member part  
  └─md3           1,8T LVM2_member       raid1 
    └─fg01-Data   5,5T ext4              lvm   /data
sdg               1,8T                   disk  
└─sdg1            1,8T linux_raid_member part  
  └─md3           1,8T LVM2_member       raid1 
    └─fg01-Data   5,5T ext4              lvm   /data
sdh             119,2G                   disk  
└─sdh1          119,2G ext4              part  /home
sr0              1024M                   rom   
nvme0n1           477G                   disk  
├─nvme0n1p1       300M vfat              part  /boot/efi
├─nvme0n1p2     442,1G ext4              part  /
└─nvme0n1p3      34,6G swap              part  [SWAP]

PROMPT > cat /proc/mdstat 
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md3 : active raid1 sdf1[1] sdg1[0]
      1953381376 blocks super 1.2 [2/1] [U_]
      [==>..................]  recovery = 10.0% (196493504/1953381376) finish=224.9min speed=130146K/sec
      bitmap: 0/15 pages [0KB], 65536KB chunk

md2 : active raid1 sda1[1] sde1[0]
      3906884608 blocks super 1.2 [2/1] [U_]
      [=>...................]  recovery =  6.7% (263818176/3906884608) finish=429.0min speed=141512K/sec
      bitmap: 2/30 pages [8KB], 65536KB chunk

unused devices: <none>

Answer

@nh2は簡単な答えだが危険かもしれない彼の答えの解決策パーティションを使用してmdadmアレイを作成する場合とディスク全体を直接使用する場合の違いは何ですか

ちなみに、このような事態が起こっても、データは失われません。おそらくsgdisk --zapデバイスだけを削除して、たとえばmdadm --create /dev/md0 --level=1 --raid-devices=2 /dev/sdc /dev/sdd(mdadm は過去のデータをすでに検出したことを通知し、そのデータを引き続き再利用するかどうかを尋ねます) を使用して RAID を再作成できます。私はこれを複数回試しましたが、うまくいきましたが、実行する前にバックアップを取ることをお勧めします。

長い調査の末、なんとか解決策を見つけることができました。

私がやったことはこれです

まずステータス情報

PROMPT> df -h
Dateisystem           Größe Benutzt Verf. Verw% Eingehängt auf
/dev/mapper/fg00-Data  5,4T    1,5T  3,8T   28% /data

次にパーティションをアンマウントします

PROMPT> umount /data

PROMPT> cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sdg[1] sdf[0]
      1953382464 blocks super 1.2 [2/2] [UU]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md0 : active raid1 sde[1] sda[0]
      3906886464 blocks super 1.2 [2/2] [UU]
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>

2つのアレイを分解します

PROMPT > mdadm --manage /dev/md0 --fail /dev/sde
mdadm: set /dev/sde faulty in /dev/md0

PROMPT > mdadm --manage /dev/md1 --fail /dev/sdg
mdadm: set /dev/sdg faulty in /dev/md1

PROMPT > cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sdg[1](F) sdf[0]
      1953382464 blocks super 1.2 [2/1] [U_]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md0 : active raid1 sde[1](F) sda[0]
      3906886464 blocks super 1.2 [2/1] [U_]
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>

アレイからディスクを取り外す

PROMPT > mdadm --manage /dev/md0 --remove /dev/sde 
mdadm: hot removed /dev/sde from /dev/md0
PROMPT > mdadm --manage /dev/md1 --remove /dev/sdg
mdadm: hot removed /dev/sdg from /dev/md1

PROMPT > cat /proc/mdstat
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md1 : active raid1 sdf[0]
      1953382464 blocks super 1.2 [2/1] [U_]
      bitmap: 0/15 pages [0KB], 65536KB chunk

md0 : active raid1 sda[0]
      3906886464 blocks super 1.2 [2/1] [U_]
      bitmap: 0/30 pages [0KB], 65536KB chunk

unused devices: <none>

現在/dev/sde、とは/dev/sdg自由に (再) パーティション化できます。

/dev/sdeそこで、/dev/sdg提案されたとおり、使用可能なスペースよりも数 MB 小さい新しいパーティションを作成しました。
1 つのアクティブディスクと 1 つの「欠落」ディスクを持つ新しい 2 ディスク RAID1 アレイを作成しました。
新しいアレイを物理ボリュームとして新しいLVMボリュームグループを構築しました
その上に論理ボリュームを作成しました（パーティション作成時に失われた数MBを除いた、古いものと同じサイズ）
古いLVから新しいLVにすべてのデータをコピーしました
古いRAIDを破壊し、~~ディスクの~~パーティションを新しいものに追加しました

これが新しい状況です

PROMPT > lsblk -o NAME,SIZE,FSTYPE,TYPE,MOUNTPOINT
NAME              SIZE FSTYPE            TYPE  MOUNTPOINT
sda               3,7T                   disk  
└─sda1            3,7T linux_raid_member part  
  └─md2           3,7T LVM2_member       raid1 
    └─fg01-Data   5,5T ext4              lvm   /data
sde               3,7T                   disk  
└─sde1            3,7T linux_raid_member part  
  └─md2           3,7T LVM2_member       raid1 
    └─fg01-Data   5,5T ext4              lvm   /data
sdf               1,8T                   disk  
└─sdf1            1,8T linux_raid_member part  
  └─md3           1,8T LVM2_member       raid1 
    └─fg01-Data   5,5T ext4              lvm   /data
sdg               1,8T                   disk  
└─sdg1            1,8T linux_raid_member part  
  └─md3           1,8T LVM2_member       raid1 
    └─fg01-Data   5,5T ext4              lvm   /data
sdh             119,2G                   disk  
└─sdh1          119,2G ext4              part  /home
sr0              1024M                   rom   
nvme0n1           477G                   disk  
├─nvme0n1p1       300M vfat              part  /boot/efi
├─nvme0n1p2     442,1G ext4              part  /
└─nvme0n1p3      34,6G swap              part  [SWAP]

PROMPT > cat /proc/mdstat 
Personalities : [linear] [multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] 
md3 : active raid1 sdf1[1] sdg1[0]
      1953381376 blocks super 1.2 [2/1] [U_]
      [==>..................]  recovery = 10.0% (196493504/1953381376) finish=224.9min speed=130146K/sec
      bitmap: 0/15 pages [0KB], 65536KB chunk

md2 : active raid1 sda1[1] sde1[0]
      3906884608 blocks super 1.2 [2/1] [U_]
      [=>...................]  recovery =  6.7% (263818176/3906884608) finish=429.0min speed=141512K/sec
      bitmap: 2/30 pages [8KB], 65536KB chunk

unused devices: <none>

mdadm RAID は LVM の基盤として機能し、再起動後に消えてしまいます。

これは新しい設定

問題

しかし、再起動時にシステムがアレイを再構成するようにするにはどうすればよいでしょうか?

アレイと LVM が稼働していなくてもデータにアクセスできますか?

追加情報

これは誰かが理解できるヒントでしょうか?

もう一つの情報

答え1

答え2

私がやったことはこれです

関連情報