mdadm - ソフトウェア RAID

mdadm - ソフトウェア RAID

小さな RAID ベースの Ubuntu 11.04 サーバー マシンをセットアップしたところ、このメールを受信しました。これを確認またはチェックするにはどうすればよいでしょうか?

リチャード

これは godzilla 上で実行されている mdadm から自動的に生成されたメール メッセージです。

md デバイス /dev/md/0 で失敗イベントが検出されました。

コンポーネントデバイス /dev/sda1 に関連している可能性があります。

敬具、など

PS /proc/mdstat ファイルには現在次の内容が含まれています。

パーソナリティ: [リニア] [マルチパス] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: アクティブ raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 ブロック スーパー 1.2 レベル 5、512k チャンク、アルゴリズム 2 [4/3] [_UUU] [>...............] チェック = 2.2% (21655188/975711744) 終了=4419.8 分 速度=3597K/秒

&> cat /proc/mdstatパーソナリティ: [リニア] [マルチパス] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: アクティブ raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 ブロック スーパー 1.2 レベル 5、512k チャンク、アルゴリズム 2 [4/3] [_UUU]

未使用のデバイス:

/proc/mdstat を cat するパーソナリティ: [リニア] [マルチパス] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: アクティブ raid5sda1[0]Fsdb1[1]sdd1[3] sdc1[2] 2927135232ブロック スーパー1.2レベル5、512kチャンク、アルゴリズム2 [4/3] [_UUU]

未使用のデバイス:

メッセージ [775549.274966] md/raid:md0: sda1 のディスク障害、デバイスを無効にします。[775549.274967] md/raid:md0: 3 つのデバイスで操作を続行します。[775549.280021] md/raid:md0: 読み取りエラーは修正できません (sda1 のセクター 43310408
)。[775549.280028] md/raid:md0: 読み取りエラーは修正できません (sda1 のセクター 43310416
)。[775549.280031] md/raid:md0: 読み取りエラーは修正できません (sda1 のセクター 43310424
)。 [775549.280035] md/raid:md0: 読み取りエラーは修正できません (sda1 上のセクター 43310432
)。[775549.280039] md/raid:md0: 読み取りエラーは修正できません (sda1 上のセクター 43310440
)。[775549.280043] md/raid:md0: 読み取りエラーは修正できません (sda1 上のセクター 43310448
)。[775549.280047] md/raid:md0: 読み取りエラーは修正できません (sda1 上のセクター 43310456
)。[775549.280051] md/raid:md0: 読み取りエラーは修正できません (sda1 上のセクター 43310464
)。 [775549.280055] md/raid:md0: 読み取りエラーは修正できません (sda1 のセクター 43310472
)。 [775549.280226] ata7: EH 完了 [775549.316567] ata7.00: 例外 Emask 0x0 SAct 0x0 SErr 0x300000 アクション 0x6 [775549.319133] ata7.00: BMDMA 統計 0x45 [775549.321658] ata7: SError: { Dispar BadCRC } [775549.324237] ata7.00: 失敗したコマンド: READ DMA EXT [775549.326754] ata7.00: cmd 25/00:f8:28:ed:94/00:03:02:00:00/e0 タグ 0 dma 52019
2 in [775549.326757] res 51/84:48:78:7f:2e/84:00:03:00:00/e0 Emask 0x10 (ATA
バス エラー) [775549.331806] ata7.00: ステータス: { DRDY ERR } [775549.334350] ata7.00: エラー: { ICRC ABRT } [775549.336890] ata7: リンクをハード リセットしています [775549.336895] ata7: nv: 占有ポートでハード リセットをスキップしています [775549.340260] md: md0: データ チェックが完了しました。 [775549.804062] ata7: SATA リンクアップ 3.0 Gbps (SStatus 123 SControl 300) [775549.844352] ata7.00: UDMA/33 用に構成されました [775549.844390] ata7: EH が完了しました [775549.936450] RAID conf プリントアウト: [775549.936456] --- レベル:5 rd:4 wd:3 [775549.936460] ディスク 0、o:0、dev:sda1 [775549.936463] ディスク 1、o:1、dev:sdb1 [775549.936465] ディスク 2、o:1、dev:sdc1 [775549.936507] ディスク 3、o:1、dev:sdd1 [775549.936557] RAID conf プリントアウト: [775549.936559] --- レベル:5 rd:4 wd:3 [775549.936562] ディスク 1、o:1、dev:sdb1 [775549.936564] ディスク 2、o:1、dev:sdc1 [775549.936567] ディスク 3、o:1、dev:sdd1

sudo mdadm --detail /dev/md0

/dev/md0: バージョン: 1.2 作成時間: 2005 年 1 月 1 日土曜日 14:43:44 Raid レベル: raid5 アレイ サイズ: 2927135232 (2791.53 GiB 2997.39 GB) 使用されているデバイス サイズ: 975711744 (930.51 GiB 999.13 GB) Raid デバイス: 4 合計デバイス数: 4 永続性: スーパーブロックは永続的です

Update Time : Sun Feb  5 19:17:41 2012
      State : clean, degraded  Active Devices : 3 Working Devices : 3  Failed Devices : 1   Spare Devices : 0

     Layout : left-symmetric
 Chunk Size : 512K

       Name : godzilla:0  (local to host godzilla)
       UUID : 7c2be5e4:25e338e5:b575b8cd:83896caf
     Events : 657

Number   Major   Minor   RaidDevice State
   0       0        0        0      removed
   1       8       17        1      active sync   /dev/sdb1
   2       8       33        2      active sync   /dev/sdc1
   3       8       49        3      active sync   /dev/sdd1

   0       8        1        -      faulty spare   /dev/sda1

答え1

'dmesg' の出力と /var/log/syslog ファイルを確認します。/dev/sda1 の問題に関するヒントがあるかもしれません。

ハード ディスクがクラッシュした可能性もありますが、ケーブルがきちんと差し込まれていないだけかもしれません (SATA ケーブルは... それほど優れたものではありません)。デバイスがまだオンラインかどうかを確認します。/dev/sde1 などの別の名前、またはシステムで次に空いている名前を使用してデバイスを使用できる可能性があります。前述のように、dmesg/syslog、SMART も確認します。ケーブルが適切に差し込まれているだけか、交換する必要がある可能性があります。ほとんどの場合、ディスクを RAID アレイに再度追加できます。問題が実際にケーブルの破損またはそれに相当する何かに関係している場合、つまり「実際の」ハード ディスク障害ではない場合にのみ、これらのコマンドを使用します。

mdadm --fail /dev/mdX /dev/sdX # set the disk faulty
mdadm -r /dev/mdX /dev/sdX # remove faulty disk
mdadm --re-add /dev/mdX /dev/sdX # re-add disk

免責事項: 保証はありません。バックアップを用意しておく必要があります。これにより RAID アレイが再構築されます。その間、冗長性などはありません。

関連情報