Auf einem HP-Server mit Windows 2008-R2. Es gibt einen PCI Silicon Image SATA-RAID-Controller mit 4 SATA-Festplatten. Im Controller befindet sich eine Konfiguration, um sie in eine Raid5-Konfiguration zu verwandeln. Windows sieht sie als 1 Laufwerk.
Als ich den Server heute Morgen neu gestartet habe, hat eine der Festplatten „gesprungen“ (mechanisch). Nach dem Geräusch wurde auf dem Bildschirm angezeigt, dass eine der Festplatten im RAID fehlte. (das war eine falsche Schlussfolgerung)
Beim Neustart der Hardware, diesmal bei geöffneter Abdeckung, ist die „fehlende“ Festplatte die einzige, die mechanisch vibriert. (der Grund für die falsche Schlussfolgerung). Wenn der Start fortgesetzt wird, zeigt das System 4 Geräte, aber kein RAID-Volume an.
Ich hatte Angst, dass die springende Festplatte die Verbindung des RAID-Volumes „aufrechterhält“. SATA ist Hotswap, also habe ich die „Errordisk“ vom RAID-Controller entfernt. Die Software meldet direkt „Gerät fehlt“. Logisch. Ich schließe sie erneut an. Beim Anschließen sehe ich, dass ich das falsche Laufwerk abgeklemmt habe. Nicht die Errordisk, sondern eine intakte. Ich wiederhole den Vorgang für die Errordisk. In diesem Moment höre ich das Geräusch erneut und folge meinen Ohren. Das „Springen“ kommt von der Ersatzfestplatte im HP-Array. Die falsche Schlussfolgerung herausfinden
Wenn ich das System neu starte, ist wieder kein RAID-Volume vorhanden. Ich gehe zum Controller-BIOS. Dort sind die Optionen begrenzt. Ich sehe 4 Geräte, die funktionieren, und ich sehe die Konfiguration eines RAID5-Sets über 4 Festplatten. Zurück in Windows starte ich die Software. Dort sehe ich, dass 1 Festplatte aktiv ist, aber nicht mehr Teil des RAID5 ist. Der Rest hat ein vorhandenes RAID-Set. (siehe Bild) Das System sagt mir, dass alle 4 Festplatten in Ordnung sind. Das System sagt mir, dass ein RAID5-Set über 3 Festplatten vorhanden ist. Aber die Schaltfläche „Neu erstellen“ ist grau. Wenn ich versuche: „Legacy-RAID-Gruppe konvertieren“, erhalte ich eine Fehlermeldung.
Was kann ich versuchen, um das Volume wiederherzustellen, ohne die Daten zu verlieren?
Screenshot der Situation drucken
Update 1: Das vorhandene Backup ist nicht aktuell genug und unvollständig. Daten können von anderen Orten übernommen werden, aber die Rekonstruktion wird viel Zeit in Anspruch nehmen und unvollständig sein. Die Aktualisierung des Servers auf eine neuere Version ist ein laufendes Gespräch, wobei dies Konsequenzen für die Personen hat, die den Server auf verschiedenen Ebenen nutzen. Sie wissen, dass sie es tun müssen, aber sie zögern es hinaus.
Antwort1
Überprüfen Sie die Seriennummer der fehlerhaften Festplatte. Der Controller hat Ihnen den Fehler gemeldet und validieren Sie diese bei ausgeschaltetem Server, bevor Sie den Server neu starten.
Beim Neustart der Hardware, diesmal bei geöffneter Haube, vibriert nur die "fehlende" Festplatte mechanisch (der Grund für die falsche Schlussfolgerung). Wenn der Start fortgesetzt wird,Das System zeigt 4 Geräte an, aber kein RAID-Volume.
Leider sind alle Schritte zur Wiederherstellung, die Sie nach dem fettgedruckten Text unternommen haben, vergeblich, da beim ersten Neustart das RAID-Array anscheinend vom Controller gelöscht wurde.
Bedenken Sie, dass ein Laufwerk bei normalem Gebrauch ticken und Geräusche machen kann. Dies ist nicht der Hauptfaktor, um das fehlerhafte Laufwerk zu erkennen. Wenn der Controller das nächste Mal eine Festplatte mit der Seriennummer X als fehlerhaft anzeigt, verwenden Sie dies als Möglichkeit, sie zu finden. Wenn eine Festplatte daneben ein Schreckgeräusch macht, können Sie davon ausgehen, dass Ihr Array auch bald ausfallen könnte, insbesondere in einem RAID5-Setup, bei dem nur ein Mitglied offline sein kann. Leider ist das Schreckgeräusch eine Warnung, damit Sie sicherstellen, dass Sie ein Backup in der Nähe haben.
Ich rate Ihnen, Ihre Daten aus einer Sicherung wiederherzustellen, den defekten Controller möglicherweise zu entsorgen und bei Bedarf auf ein unterstütztes Betriebssystem zu aktualisieren.