私の主な仕事用マシンには、Windows 10 で動作する 3TB のソフトウェア RAID ボリュームがあり、物理的には 2 つの 3TB 回転ディスクがあります。ブート ボリュームは別の NVMe SSD です。たとえば、停電後の RAID ボリュームの再同期プロセスには、約 5 時間の連続したオン時間が必要です。
簡単な実験をしてみました:
- 再起動、ログオン、ボリュームが同期しているかどうかの確認、順番に電源をオフにします。過去の経験から、この時点で再起動、ログオン、ボリュームの状態の確認を行えば、RAID が同期していることが分かります。
- 両方の 3TB ドライブの電源を切断し、再起動してログオンし、順番に電源をオフにします。
- 両方の 3TB ドライブに電源を再接続し、再起動してログオンし、ボリュームの状態を確認します。
RAID の再同期プロセスが開始されました。両方のドライブが切断されたという事実が NVMe ドライブの Windows ブート ボリュームに記録され、再同期をトリガーするのに十分であると結論付けました。
これを回避するにはどうすればよいでしょうか? ドライブを再接続する前に何かできるとよいのですが、ドライブを切断する前に何かしても構いません。
当初の動機と報告:
時々、そのPCでクラッシュする可能性のあるものを作りたくなります。昨日は友人のM.2 SSDをあさっていたのですが、そのSSDには不良ブロックが増殖してBIOS警告を引き起こし、別のボリュームからの起動も含めてWindowsの起動を妨げていることがわかりました。そこで私は
- RAIDボリュームが同期していることを確認し、マシンの電源を切りました
- 2つの回転式ドライブの電源コネクタを外し、故障したM.2をセカンダリポートに接続しました
- プライマリポートのNVMeからWindowsを起動しようとしましたが、カーソルが15分ほど回転し続けました。
- Linux USBキーを接続し、リセットし、そこから起動し、故障したM.2 SSDから重要なデータを抽出した。
- 電源をオフにし、故障したM.2 SSDを取り外し、電源コネクタを再接続しました
- NVMeからWindowsを再起動しました。
残念なことに、RAID 再同期プロセスが開始されました。
答え1
そのプロセス中に RAID ドライブには何の変化も見られなかったと思いますが、オフラインのときにアレイ内のドライブを切断して、たとえば不揮発性表面スキャンを実行することもできます。再構築プロセスが開始された場合、ドライブの 1 つ (または両方) で何かが変化しています (これは、状態が悪化していることを示している可能性があります)。
各ドライブでスキャンを実行して、まだ正常かどうかを確認することをお勧めします。ソフトウェア RAID とハードウェア RAID のどちらを実行しているかはわかりませんが、最も安全なのは、電源をオフにして、起動可能なツールを使用して各ドライブの表面スキャンを個別に実行することです (読み取り専用)。ハードウェア RAID の場合は、ポートを切り替えるか、カードの BIOS で RAID を JBOD 設定に変更する必要があります。
長期的には、RAID は残しておくことを強くお勧めします。ご存知のとおり、再構築プロセスにはますます長い時間がかかります (Areca RAID カードで 4TB ドライブを最後に使用したときは約 36 時間でした)。その期間中に、おそらく 2 つのドライブを同時に購入し、まったく同じ消耗を経験しているため、もう 1 つのドライブも故障する可能性があります。
答え2
Windows Server カタログを使用して、SSD が Windows Server 2016 および Windows Server 2019 で認定されていることを確認します。ドライブが Storage Spaces Direct と互換性があるかどうかをベンダーに問い合わせます。ストレージ管理ソフトウェアを使用して、ストレージ上のドライブの状態を確認します。ストレージ管理ソフトウェアを使用して、ストレージ上のドライブの状態を確認します。すべてのノードに最新の Windows 更新プログラムがインストールされていることを確認します。必要に応じて、ストレージとドライブのファームウェアを更新します。