mdadm - Software-Raid

mdadm - Software-Raid

Ich habe einen kleinen Raid-basierten Ubuntu 11.04-Server eingerichtet und gerade diese E-Mail davon erhalten. Wie kann ich das verifizieren oder überprüfen?

Richard

Dies ist eine automatisch generierte E-Mail-Nachricht von mdadm, das auf Godzilla ausgeführt wird

Auf dem MD-Gerät /dev/md/0 wurde ein Fehlerereignis erkannt.

Es könnte mit dem Komponentengerät /dev/sda1 zusammenhängen.

Mit freundlichen Grüßen usw.

PS: Die Datei /proc/mdstat enthält derzeit Folgendes:

Persönlichkeiten: [linear] [Multipfad] [Raid0] [Raid1] [Raid6] [Raid5] [Raid4] [Raid10] md0: aktiver Raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 Blöcke Super 1.2 Level 5, 512k Chunk, Algorithmus 2 [4/3] [_UUU] [>....................] Prüfung = 2,2 % (21655188/975711744) Ziel = 4419,8 Min. Geschwindigkeit = 3597 K/Sek.

&> Katze /proc/mdstatPersönlichkeiten: [linear] [Multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: aktiver Raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 Blöcke Super 1.2 Level 5, 512k Chunk, Algorithmus 2 [4/3] [_UUU]

unbenutzte Geräte:

Katze /proc/mdstatPersönlichkeiten: [linear] [Multipath] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: aktives raid5sda1[0]Fsdb1[1]sdd1[3] sdc1[2] 2927135232 Blöcke Super 1.2 Level 5, 512k Chunk, Algorithmus 2 [4/3] [_UUU]

unbenutzte Geräte:

Dmsg [775549.274966] md/raid:md0: Festplattenfehler auf sda1, Gerät wird deaktiviert. [775549.274967] md/raid:md0: Vorgang wird auf 3 Geräten fortgesetzt. [775549.280021] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310408 auf sda1
). [775549.280028] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310416 auf sda1
). [775549.280031] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310424 auf sda1
). [775549.280035] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310432 auf sda1
). [775549.280039] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310440 auf sda1
). [775549.280043] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310448 auf sda1 )
. [775549.280047] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310456 auf sda1
). [775549.280051] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310464 auf sda1
). [775549.280055] md/raid:md0: Lesefehler nicht korrigierbar (Sektor 43310472 auf sda1
). [775549.280226] ata7: EH abgeschlossen [775549.316567] ata7.00: Ausnahme Emask 0x0 SAct 0x0 SErr 0x300000 Aktion 0x6 [775549.319133] ata7.00: BMDMA stat 0x45 [775549.321658] ata7: SError: { Dispar BadCRC } [775549.324237] ata7.00: Befehl fehlgeschlagen: READ DMA EXT [775549.326754] ata7.00: cmd 25/00:f8:28:ed:94/00:03:02:00:00/e0 tag 0 dma 52019
2 in [775549.326757] res 51/84:48:78:7f:2e/84:00:03:00:00/e0 Emask 0x10 (ATA-
Busfehler) [775549.331806] ata7.00: Status: { DRDY ERR } [775549.334350] ata7.00: Fehler: { ICRC ABRT } [775549.336890] ata7: Link wird hart zurückgesetzt [775549.336895] ata7: nv: Hardreset am belegten Port wird übersprungen [775549.340260] md: md0: Datenprüfung abgeschlossen. [775549.804062] ata7: SATA-Verbindung 3,0 Gbit/s (SStatus 123 SControl 300) [775549.844352] ata7.00: konfiguriert für UDMA/33 [775549.844390] ata7: EH abgeschlossen [775549.936450] RAID-Konfigurationsausdruck: [775549.936456] --- level:5 rd:4 wd:3 [775549.936460] Datenträger 0, o:0, dev:sda1 [775549.936463] Datenträger 1, o:1, dev:sdb1 [775549.936465] Datenträger 2, o:1, dev:sdc1 o:1, dev:sdd1 [775549.936557] RAID-Konfigurationsausdruck: [775549.936559] --- level:5 rd:4 wd:3 [775549.936562] disk 1, o:1, dev:sdb1 [775549.936564] disk 2, o:1, dev:sdc1 [775549.936567] disk 3, o:1, dev:sdd1

sudo mdadm --detail /dev/md0

/dev/md0: Version: 1.2 Erstellungszeit: Samstag, 1. Januar 2005, 14:43:44 Raid-Level: raid5 Array-Größe: 2927135232 (2791,53 GiB 2997,39 GB) Verwendete Dev-Größe: 975711744 (930,51 GiB 999,13 GB) Raid-Geräte: 4 Gesamtgeräte: 4 Persistenz: Superblock ist persistent

Update Time : Sun Feb  5 19:17:41 2012
      State : clean, degraded  Active Devices : 3 Working Devices : 3  Failed Devices : 1   Spare Devices : 0

     Layout : left-symmetric
 Chunk Size : 512K

       Name : godzilla:0  (local to host godzilla)
       UUID : 7c2be5e4:25e338e5:b575b8cd:83896caf
     Events : 657

Number   Major   Minor   RaidDevice State
   0       0        0        0      removed
   1       8       17        1      active sync   /dev/sdb1
   2       8       33        2      active sync   /dev/sdc1
   3       8       49        3      active sync   /dev/sdd1

   0       8        1        -      faulty spare   /dev/sda1

Antwort1

Ich würde mir mal die Ausgabe von 'dmesg' sowie die Datei /var/log/syslog ansehen. Vielleicht gibt es da Hinweise auf Probleme mit /dev/sda1.

Die Festplatte könnte abgestürzt sein, aber es könnte auch einfach ein nicht richtig eingestecktes Kabel sein (SATA-Kabel sind einfach... nicht so toll). Schau mal, ob das Gerät noch online ist, vielleicht ist es unter einem anderen Namen wie /dev/sde1 oder was auch immer der nächste freie Name in deinem System ist, erreichbar. Wie erwähnt, würde ich auch dmesg/syslog, SMART prüfen. Vielleicht muss das Kabel nur richtig eingesteckt oder ausgetauscht werden. In den meisten Fällen kannst du die Platte wieder zu deinem RAID-Array hinzufügen - ich würde diese Befehle nur verwenden, wenn das Problem wirklich mit kaputten Kabeln oder etwas Vergleichbarem zu tun hat, also kein "echter" Festplattenfehler vorliegt.

mdadm --fail /dev/mdX /dev/sdX # set the disk faulty
mdadm -r /dev/mdX /dev/sdX # remove faulty disk
mdadm --re-add /dev/mdX /dev/sdX # re-add disk

Haftungsausschluss: Keine Garantie. Sie sollten über Backups verfügen, damit wird Ihr RAID-Array neu aufgebaut – für diese Zeit gibt es keine Redundanz usw.

verwandte Informationen