Gerät im MD-RAID ausfallen lassen, wenn ATA nicht mehr reagiert

Question

Deltik, Sie haben die mdFunktionsweise von Linux Software-RAID () falsch verstanden.

mdmacht aus mehreren Geräten oder Partitionen ein virtuelles Blockgerät und weiß nicht, welche Daten Sie zum und vom virtuellen Gerät übertragen.
Sie hofften, dass es Dinge tun könnte, für die es nicht konzipiert war.

Antworten

1. Warum tritt `md`bei nicht reagierendem Laufwerk/nicht reagierender Partition kein Fehler auf?

Dies liegt daran, mdhat keine Ahnung, ob

das Laufwerk ist mit I/O von etwas beschäftigt, das mdes selbst angefordert hat, oder
das Laufwerk wurde aufgrund externer Umstände blockiert, z. B. aufgrund der Fehlerbehebung des Laufwerks selbst oder in Ihrem Fall aufgrund eines ATA Secure Erase.

also mdwerde ich abwarten, was das Laufwerk zurückgibt. Das Laufwerk hat letztendlich keine Lese- oder Schreibfehler zurückgegeben. Wenn ein Lesefehler aufgetreten wäre, mdhätte ich ihn automatisch über die Parität behoben, und wenn ein Schreibfehler aufgetreten wäre, mdwäre das Gerät ausgefallen (siehe Abschnitt „Wiederherstellung“ immdmanpage).

Da weder ein Lese- noch ein Schreibfehler vorlag, mdwurde die Verwendung des Geräts fortgesetzt, nachdem der Kernel auf eine Antwort gewartet hatte.

2. Kann ich das Laufwerk/die Partition aus dem Array löschen, während das Laufwerk blockiert ist?

Nein. Das /dev/md0RAID-Gerät ist gesperrt und kann nicht geändert werden, bis die Sperre aufgehoben wird.

Sie haben das Flag -foder --failan den mdadmModus „Verwalten“ übergeben.
Hier ist eine Übersicht darüber, was das tatsächlich bewirkt:

Dies ist der Quellcode zur Funktionsweise dieser Flagge:

case 'f': /* set faulty */
    /* FIXME check current member */
    if ((sysfd >= 0 && write(sysfd, "faulty", 6) != 6) ||
        (sysfd < 0 && ioctl(fd, SET_DISK_FAULTY,
                rdev))) {
        if (errno == EBUSY)
            busy = 1;
        pr_err("set device faulty failed for %s:  %s\n",
            dv->devname, strerror(errno));
        if (sysfd >= 0)
            close(sysfd);
        goto abort;
    }
    if (sysfd >= 0)
        close(sysfd);
    sysfd = -1;
    count++;
    if (verbose >= 0)
        pr_err("set %s faulty in %s\n",
            dv->devname, devname);
    break;

write(sysfd, "faulty", 6)Beachten Sie , dass es sich beim Aufruf sysfdum eine Variable handelt, die zuvor in der Datei festgelegt wurde:
sysfd = sysfs_open(fd2devnm(fd), dname, "block/dev");

sysfs_open()ist eine Funktion vonDiese Datei:

int sysfs_open(char *devnm, char *devname, char *attr)
{
    char fname[50];
    int fd;

    sprintf(fname, "/sys/block/%s/md/", devnm);
    if (devname) {
        strcat(fname, devname);
        strcat(fname, "/");
    }
    strcat(fname, attr);
    fd = open(fname, O_RDWR);
    if (fd < 0 && errno == EACCES)
        fd = open(fname, O_RDONLY);
    return fd;
}

Wenn Sie den Funktionen folgen, werden Sie feststellen, dass mdadm /dev/md0 -f /dev/sdb1im Wesentlichen Folgendes geschieht:

echo "faulty" > /sys/block/md0/md/dev-sdb1/block/dev

Diese Anfrage wartet und wird nicht sofort ausgeführt, da /dev/md0sie blockiert ist.

3. Kann ein Timeout konfiguriert werden, sodass `md`ein Laufwerk, das nicht auf ATA-Befehle reagiert, automatisch ausfällt?

Ja. TatsächlichStandardmäßig beträgt das Timeout 30 Sekunden:

root@node51 [~]# cat /sys/block/sdb/device/timeout
30

Das Problem bei Ihrer Annahme war, dass Ihr Laufwerk tatsächlich damit beschäftigt war, einen ATA-Befehl auszuführen (für 188 Minuten), sodass es nicht zu einer Zeitüberschreitung kam.

Einzelheiten hierzu finden Sie imDokumentation zur SCSI-Fehlerbehandlung im Linux-Kernel.

4. Warum kann ich `md`ein Gerät mit ungültigen Daten weiter verwenden?

Als ATA Secure Erase abgeschlossen war, meldete das Laufwerk keine Probleme (z. B. einen abgebrochenen Befehl) und es mdgab daher keinen Grund zur Annahme, dass ein Problem vorlag.

Darüber hinaus wurde die Partitionstabelle im Arbeitsspeicher des Kernels in Ihrem Fall, in dem Sie Partitionen statt ganzer Festplatten als RAID-Geräte verwendet haben, nicht darüber informiert, dass die Partition auf dem gelöschten Laufwerk nicht mehr vorhanden war, und mdkonnte daher weiterhin auf Ihr Laufwerk zugreifen, /dev/sdb1als wäre nichts schiefgegangen.

Dies ist aus demmdmanpage:

Bereinigung und Nichtübereinstimmungen

Da Speichergeräte jederzeit fehlerhafte Blöcke entwickeln können, ist es sinnvoll, regelmäßig alle Blöcke auf allen Geräten in einem Array zu lesen, um solche fehlerhaften Blöcke frühzeitig zu erkennen. Dieser Prozess wird alsSchrubben.

MD-Arrays können gelöscht werden durch Schreiben vonüberprüfenoderReparaturzur Dateimd/SynchronisierungsaktionimsysfsVerzeichnis für das Gerät.

Wenn Sie einen Scrub anfordern, liest md jeden Block auf jedem Gerät im Array und prüft, ob die Daten konsistent sind. Bei RAID1 und RAID10 bedeutet dies, dass geprüft wird, ob die Kopien identisch sind. Bei RAID4, RAID5 und RAID6 bedeutet dies, dass geprüft wird, ob der Paritätsblock (oder die Blöcke) korrekt ist (sind).

Daraus können wir schließen, dass die Parität normalerweise nicht bei jedem Festplatten-Lesevorgang überprüft wird. (Außerdem würde die Überprüfung der Parität bei jedem Lesevorgang die Leistung stark beeinträchtigen, da dadurch die Anzahl der Transaktionen erhöht würde, die nur zum Abschließen eines Lesevorgangs erforderlich sind, und der Vergleich der Parität mit den gelesenen Daten ausgeführt würde.)

Im Normalbetrieb mdgeht es einfach davon aus, dass die gelesenen Daten gültig sind, wodurch es anfällig ist fürstille Datenbeschädigung. In Ihrem Fall waren die Daten auf der gesamten Festplatte unbemerkt beschädigt, weil Sie sie gelöscht hatten.

Ihr Dateisystem war sich der Beschädigung nicht bewusst. Es traten Eingabe-/Ausgabefehler auf Dateisystemebene auf, weil das Dateisystem nicht verstehen konnte, warum es fehlerhafte Daten hatte.

Um eine unbemerkte Datenbeschädigung zu vermeiden,tue nie wieder, was du getan hast. Zweitens: Erwägen Sie die VerwendungZFS, ein Dateisystem, das sich auf die Datenintegrität konzentriert und stille Datenbeschädigungen erkennt und korrigiert.

Answer 1

Deltik, Sie haben die mdFunktionsweise von Linux Software-RAID () falsch verstanden.

mdmacht aus mehreren Geräten oder Partitionen ein virtuelles Blockgerät und weiß nicht, welche Daten Sie zum und vom virtuellen Gerät übertragen.
Sie hofften, dass es Dinge tun könnte, für die es nicht konzipiert war.

Antworten

1. Warum tritt `md`bei nicht reagierendem Laufwerk/nicht reagierender Partition kein Fehler auf?

Dies liegt daran, mdhat keine Ahnung, ob

das Laufwerk ist mit I/O von etwas beschäftigt, das mdes selbst angefordert hat, oder
das Laufwerk wurde aufgrund externer Umstände blockiert, z. B. aufgrund der Fehlerbehebung des Laufwerks selbst oder in Ihrem Fall aufgrund eines ATA Secure Erase.

also mdwerde ich abwarten, was das Laufwerk zurückgibt. Das Laufwerk hat letztendlich keine Lese- oder Schreibfehler zurückgegeben. Wenn ein Lesefehler aufgetreten wäre, mdhätte ich ihn automatisch über die Parität behoben, und wenn ein Schreibfehler aufgetreten wäre, mdwäre das Gerät ausgefallen (siehe Abschnitt „Wiederherstellung“ immdmanpage).

Da weder ein Lese- noch ein Schreibfehler vorlag, mdwurde die Verwendung des Geräts fortgesetzt, nachdem der Kernel auf eine Antwort gewartet hatte.

2. Kann ich das Laufwerk/die Partition aus dem Array löschen, während das Laufwerk blockiert ist?

Nein. Das /dev/md0RAID-Gerät ist gesperrt und kann nicht geändert werden, bis die Sperre aufgehoben wird.

Sie haben das Flag -foder --failan den mdadmModus „Verwalten“ übergeben.
Hier ist eine Übersicht darüber, was das tatsächlich bewirkt:

Dies ist der Quellcode zur Funktionsweise dieser Flagge:

case 'f': /* set faulty */
    /* FIXME check current member */
    if ((sysfd >= 0 && write(sysfd, "faulty", 6) != 6) ||
        (sysfd < 0 && ioctl(fd, SET_DISK_FAULTY,
                rdev))) {
        if (errno == EBUSY)
            busy = 1;
        pr_err("set device faulty failed for %s:  %s\n",
            dv->devname, strerror(errno));
        if (sysfd >= 0)
            close(sysfd);
        goto abort;
    }
    if (sysfd >= 0)
        close(sysfd);
    sysfd = -1;
    count++;
    if (verbose >= 0)
        pr_err("set %s faulty in %s\n",
            dv->devname, devname);
    break;

write(sysfd, "faulty", 6)Beachten Sie , dass es sich beim Aufruf sysfdum eine Variable handelt, die zuvor in der Datei festgelegt wurde:
sysfd = sysfs_open(fd2devnm(fd), dname, "block/dev");

sysfs_open()ist eine Funktion vonDiese Datei:

int sysfs_open(char *devnm, char *devname, char *attr)
{
    char fname[50];
    int fd;

    sprintf(fname, "/sys/block/%s/md/", devnm);
    if (devname) {
        strcat(fname, devname);
        strcat(fname, "/");
    }
    strcat(fname, attr);
    fd = open(fname, O_RDWR);
    if (fd < 0 && errno == EACCES)
        fd = open(fname, O_RDONLY);
    return fd;
}

Wenn Sie den Funktionen folgen, werden Sie feststellen, dass mdadm /dev/md0 -f /dev/sdb1im Wesentlichen Folgendes geschieht:

echo "faulty" > /sys/block/md0/md/dev-sdb1/block/dev

Diese Anfrage wartet und wird nicht sofort ausgeführt, da /dev/md0sie blockiert ist.

3. Kann ein Timeout konfiguriert werden, sodass `md`ein Laufwerk, das nicht auf ATA-Befehle reagiert, automatisch ausfällt?

Ja. TatsächlichStandardmäßig beträgt das Timeout 30 Sekunden:

root@node51 [~]# cat /sys/block/sdb/device/timeout
30

Das Problem bei Ihrer Annahme war, dass Ihr Laufwerk tatsächlich damit beschäftigt war, einen ATA-Befehl auszuführen (für 188 Minuten), sodass es nicht zu einer Zeitüberschreitung kam.

Einzelheiten hierzu finden Sie imDokumentation zur SCSI-Fehlerbehandlung im Linux-Kernel.

4. Warum kann ich `md`ein Gerät mit ungültigen Daten weiter verwenden?

Als ATA Secure Erase abgeschlossen war, meldete das Laufwerk keine Probleme (z. B. einen abgebrochenen Befehl) und es mdgab daher keinen Grund zur Annahme, dass ein Problem vorlag.

Darüber hinaus wurde die Partitionstabelle im Arbeitsspeicher des Kernels in Ihrem Fall, in dem Sie Partitionen statt ganzer Festplatten als RAID-Geräte verwendet haben, nicht darüber informiert, dass die Partition auf dem gelöschten Laufwerk nicht mehr vorhanden war, und mdkonnte daher weiterhin auf Ihr Laufwerk zugreifen, /dev/sdb1als wäre nichts schiefgegangen.

Dies ist aus demmdmanpage:

Bereinigung und Nichtübereinstimmungen

Da Speichergeräte jederzeit fehlerhafte Blöcke entwickeln können, ist es sinnvoll, regelmäßig alle Blöcke auf allen Geräten in einem Array zu lesen, um solche fehlerhaften Blöcke frühzeitig zu erkennen. Dieser Prozess wird alsSchrubben.

MD-Arrays können gelöscht werden durch Schreiben vonüberprüfenoderReparaturzur Dateimd/SynchronisierungsaktionimsysfsVerzeichnis für das Gerät.

Wenn Sie einen Scrub anfordern, liest md jeden Block auf jedem Gerät im Array und prüft, ob die Daten konsistent sind. Bei RAID1 und RAID10 bedeutet dies, dass geprüft wird, ob die Kopien identisch sind. Bei RAID4, RAID5 und RAID6 bedeutet dies, dass geprüft wird, ob der Paritätsblock (oder die Blöcke) korrekt ist (sind).

Daraus können wir schließen, dass die Parität normalerweise nicht bei jedem Festplatten-Lesevorgang überprüft wird. (Außerdem würde die Überprüfung der Parität bei jedem Lesevorgang die Leistung stark beeinträchtigen, da dadurch die Anzahl der Transaktionen erhöht würde, die nur zum Abschließen eines Lesevorgangs erforderlich sind, und der Vergleich der Parität mit den gelesenen Daten ausgeführt würde.)

Im Normalbetrieb mdgeht es einfach davon aus, dass die gelesenen Daten gültig sind, wodurch es anfällig ist fürstille Datenbeschädigung. In Ihrem Fall waren die Daten auf der gesamten Festplatte unbemerkt beschädigt, weil Sie sie gelöscht hatten.

Ihr Dateisystem war sich der Beschädigung nicht bewusst. Es traten Eingabe-/Ausgabefehler auf Dateisystemebene auf, weil das Dateisystem nicht verstehen konnte, warum es fehlerhafte Daten hatte.

Um eine unbemerkte Datenbeschädigung zu vermeiden,tue nie wieder, was du getan hast. Zweitens: Erwägen Sie die VerwendungZFS, ein Dateisystem, das sich auf die Datenintegrität konzentriert und stille Datenbeschädigungen erkennt und korrigiert.

Gerät im MD-RAID ausfallen lassen, wenn ATA nicht mehr reagiert

WARNUNG

Fragen

Antwort1

Antworten

1. Warum tritt `md`bei nicht reagierendem Laufwerk/nicht reagierender Partition kein Fehler auf?

2. Kann ich das Laufwerk/die Partition aus dem Array löschen, während das Laufwerk blockiert ist?

3. Kann ein Timeout konfiguriert werden, sodass `md`ein Laufwerk, das nicht auf ATA-Befehle reagiert, automatisch ausfällt?

4. Warum kann ich `md`ein Gerät mit ungültigen Daten weiter verwenden?

Bereinigung und Nichtübereinstimmungen

verwandte Informationen

WARNUNG

Fragen

Antwort1

Antworten

1. Warum tritt mdbei nicht reagierendem Laufwerk/nicht reagierender Partition kein Fehler auf?

2. Kann ich das Laufwerk/die Partition aus dem Array löschen, während das Laufwerk blockiert ist?

3. Kann ein Timeout konfiguriert werden, sodass mdein Laufwerk, das nicht auf ATA-Befehle reagiert, automatisch ausfällt?

4. Warum kann ich mdein Gerät mit ungültigen Daten weiter verwenden?

Bereinigung und Nichtübereinstimmungen

verwandte Informationen

1. Warum tritt `md`bei nicht reagierendem Laufwerk/nicht reagierender Partition kein Fehler auf?

3. Kann ein Timeout konfiguriert werden, sodass `md`ein Laufwerk, das nicht auf ATA-Befehle reagiert, automatisch ausfällt?

4. Warum kann ich `md`ein Gerät mit ungültigen Daten weiter verwenden?