Finden Sie heraus, warum Mdadm eine Festplatte gelöscht hat

Finden Sie heraus, warum Mdadm eine Festplatte gelöscht hat

In den letzten ein oder zwei Monaten hat mdadm zweimal eine Festplatte gelöscht. Als ich sie das letzte Mal wieder hinzugefügt habe, lief sie eine Zeit lang einwandfrei, dann bemerkte ich, dass sie wieder im herabgesetzten Modus lief. Ich fragte mich, wie ich den „Grund“ finden konnte, warum die Festplatte gelöscht wurde.

Antwort1

Sie sollten die Systemprotokolle lesen: normalerweise /var/log/messagesund/oder die Ausgabe des journalctl -xeBefehls. Wenn das Laufwerk vor Kurzem ausgefallen ist, enthält der Kernel-Nachrichtenpuffer (mit dem dmesgBefehl einsehbar) möglicherweise auch Nachrichten dazu.

Normalerweise dmesgwerden die Nachrichten auch in den Protokollen gespeichert, aber das Protokollierungssubsystem ist möglicherweise so konfiguriert, dass einige der Kernelnachrichten mit niedrigerer Priorität ignoriert werden, sodass die dmesgAusgabe möglicherweise mehr Details enthält.

Was Sie wahrscheinlich sehen werden, ist eine Reihe von Festplatten-E/A-Fehler-/Timeout-Meldungen und irgendwo dazwischen oder danach eine Meldung vom RAID-Subsystem, dass es das Laufwerk als ausgefallen markiert. Wenn das RAID-Subsystem feststellt, dass eine Festplatte anfängt, zu melden, dass E/A-Anfragen (Lesen oder Schreiben) fehlschlagen oder bei ihnen eine Zeitüberschreitung auftritt, wird die Festplatte grundsätzlich als ausgefallen markiert.

Um weitere Hinweise zu erhalten, können Sie auch die gelöschte Festplatte untersuchen smartctl -a, um zu sehen, welche Ergebnisse ihre eigenen internen Integritätsprüfungen melden.

verwandte Informationen