
Wir betreuen einen Fujitsu RX300 S4-Server mit 6 x 500 GB SATA-Laufwerken in einem RAID-6-Array, der von einer LSI MegaRAID-Karte (in die Hauptplatine integriert) betrieben wird.
Vor ein paar Wochen hat sich eine Festplatte als fehlerhaft gemeldet (orangefarbenes Licht am Laufwerksschacht, die MegaRAIDcli-Software zeigt den Firmware-Status „Fehlerhaft“). Wir haben die Festplatte bestellt und ausgetauscht, aber nach dem Beginn des Wiederaufbaus hat sich eine andere Festplatte als fehlerhaft gemeldet.
Dies ist jetzt dreimal passiert – zweimal wurden unterschiedliche Laufwerke mit einem Fehler angezeigt und einmal ein Laufwerk, das wir bereits ausgetauscht hatten.
Momentan weisen zwei Laufwerke Fehler auf - wir wissen nicht, ob die LaufwerkeGenau genommenausfällt oder ob die Backplane oder die RAID-Karte defekt ist.
Hat das schon mal jemand erlebt? Irgendwelche Tipps, was als nächstes zu tun ist? Wir haben Fujitsu angerufen, fragen uns aber, ob jemand da draußen irgendwelche Hinweise hat …
Antwort1
Ich fühle mit Ihnen. Diese Art von Hardwareproblemen ist extrem stressig und das Debuggen nervt.
Im Jahr 2002 hatte ich das „Vergnügen“, ein ähnliches Problem zu debuggen. Nach viel zu vielen „Lasst uns eine Festplatte austauschen“- und ähnlichen Server-Massagen war die Backplane der eigentliche Fehler. Aber das war sowieso ein IBM-Server und eine ganz andere Geschichte.
Wenn möglich, testen Sie die „fehlerhaften“ Laufwerke mit einem anderen Server und prüfen Sie, ob sie dort normal funktionieren. Mein Bauchgefühl sagt mir, dass es in Ihrem Fall nicht an den Laufwerken liegt, sondern dass etwas anderes kaputt ist. Normalerweise gehen Laufwerke nicht auf diese Weise kaputt.
Antwort2
Dies könnte an einem fehlerhaften Controller liegen. Es könnte an einer unzuverlässigen Stromversorgung liegen. Es könnten schlechte SATA-Kabel sein. Es könnte einfach extremes Pech sein.