Raid 5 mit Hotspare oder RAID 10 ohne Hotspare?

Raid 5 mit Hotspare oder RAID 10 ohne Hotspare?

Ja, das ist eine dieser „Mach meinen Job für mich“-Fragen, hab ein bisschen Mitleid :)

Ich bin am Limit dessen, was ich mit der Anzahl der Festplatten in einem Server machen kann, ohne viel Geld auszugeben. Ich muss noch vier Laufwerke konfigurieren und kann sie entweder als RAID 5 einrichten und ein Hotspare zuweisen oder als RAID 10 ohne Hotspare. Die Größe ist bei beiden gleich und RAID 5 bietet ausreichend Leistung.

Ich bin RAID 5-scheu, aber mir gefällt auch die Idee nicht, ohne Hotspare zu arbeiten. Mich interessiert nicht so sehr die Leistungseinbuße, sondern die Zeit, die das System ohne ausreichende Redundanz ist. Für den Server und die Laufwerke gilt ein 13x5-Reaktionsvertrag mit 4 Stunden (obwohl ich zufällig weiß, dass der nächste Serviceprovider im Winter mindestens 2-3 Autostunden entfernt ist).

Ich sollte anmerken, dass der Server auch zwei RAID 1-Arrays hat, die ebenfalls durch das Hotspare geschützt wären. Warum stellen sie keine Laufwerkskäfige mit 9 Einschüben her? Heh.

Antwort1

Wie hoch ist die Ausfalltoleranz des Arrays? Befindet es sich physisch in der Nähe oder in einem entfernten Rechenzentrum? Wenn Sie es tolerieren können, können Sie grundsätzlich mit einem Cold Spare RAID10 durchführen. Das Spare befindet sich in der Nähe, aber Sie müssen den Austausch physisch durchführen. Wenn dies kein akzeptables Szenario ist, ist RAID5 mit einem Hot Spare die einzige verbleibende Lösung.

Da Sie bereits zwei RAID1-Sets mit einer Laufwerksausfalltoleranz haben, gewinnen Sie durch RAID10 ohne Hotspare nichts. Ihr gesamtes Array kann immer noch nur den Ausfall eines einzigen Laufwerks überstehen.

Antwort2

Diese Raids sind alle relativ zueinander und gehen davon aus, dass sich im Array dieselben Festplatten und Controller befinden.

  • Raid5: Gute Lesegeschwindigkeit, schlechte Schreibgeschwindigkeit, kann jeden doppelten Festplattenausfall überstehen, wenn die Ausfälle lange genug auftreten, damit das Raid zwischen den Ausfällen neu aufgebaut werden kann. (d. h. Festplatte fällt aus, Raid wird neu aufgebaut, Festplatte fällt aus, alles ist ok). Wenn Sie gleichzeitig doppelte Festplattenausfälle haben, haben Sie Pech gehabt, es sei denn, einer der Ausfälle betrifft das Hotspare. Bei einem Array mit 4 Festplatten wird Ihnen die Hälfte der doppelten Festplattenausfälle den Tag verderben.

  • Raid6: Gute Lesegeschwindigkeit, wirklich miese Schreibgeschwindigkeit. Kann jeden doppelten Festplattenausfall überstehen. Wird nicht so häufig implementiert wie die anderen Raids.

  • Raid10: Gute Lese- und Schreibgeschwindigkeiten, kann jeden einzelnen Festplattenausfall überstehen, kann (im Fall eines 4-Festplatten-Raids) die Hälfte aller möglichen doppelten Festplattenausfälle überstehen.

  • Drei-Wege-Spiegel + Hotspare: viel weniger Platz, kann jeden doppelten Festplattenausfall und den Ausfall von bis zu 3 Festplatten überstehen, wenn die Ausfälle lange genug auftreten, damit der Spiegel einmal neu erstellt werden kann. Ich bin nicht sicher, wie viele Controller/Betriebssysteme dies unterstützen, aber es war eine Funktion, die ich in Solaris mit dem MD-Zeug vor ZFS verwendet habe.

Dabei gibt es einige Punkte, die Anlass zur Sorge geben:

  1. Wie lange dauert es, ein Array neu aufzubauen? Sun begann mit der Entwicklung von ZFS, als sie erkannten, dass in manchen Situationen die Zeit zum Neuaufbau eines RAID-5-Arrays größer ist als die MTBF der Festplatten im Array, was praktisch garantiert, dass ein Festplattenausfall zu einem Array-Ausfall führt.

  2. Festplatten aus derselben Produktionscharge können alle den gleichen Fehler aufweisen (entweder wurde die Palette fallen gelassen oder sie haben zu vielKleber auf die Platten, als sie die Platten herstellten)

  3. Je komplexer das RAID-Array, desto komplexer die Software auf dem Controller/der Implementierung. Ich habe genauso viele RAID-Controller gesehen, die Arrays zerstören, wie ausgefallene Festplatten Arrays zerstören. Ich habe einzelne Festplatten jahrelang rotieren sehen – die meisten tun das tatsächlich. Das zuverlässigste System, das ich je hatte, war eine Box mit nichts Redundantem, bei der einfach nie ein Komponentenausfall auftrat. Ich habe viele USVs und RAIDs und Redundanzen (fügen Sie beliebige Komponenten ein) gesehen, die Ausfälle verursachten, weil sie das System so viel komplexer machten, dass die Komplexität die Fehlerquelle war.

Sie zahlen Ihr Geld, Sie nutzen Ihr Risiko... Die Frage ist,

Fühlst du Glück?

Antwort3

Ich muss CHopper3 widersprechen. Da es in dieser Situation nur 4 Laufwerke gibt, ist die Ausfallwahrscheinlichkeit in beiden Szenarien gleich (2 Laufwerke), außer dass Sie bei RAID 10 ein echtes Problem haben, wenn Sie die falschen 2 Laufwerke verlieren. Außerdem ist es definitiv von Vorteil, auch für Ihre anderen RAIDs ein globales Ersatzlaufwerk zu haben.

Antwort4

Auch einige andere Dinge müssen berücksichtigt werden: Wie groß/schnell sind die einzelnen Laufwerke? Bei 1TB SATA-Laufwerken kann es in einem RAID5 ewig dauern, sie vom Hotspare wiederherzustellen, was ein großes Zeitfenster für den Ausfall eines zweiten Laufwerks offen lässt.

Sie sagen, die Leistung sei kein Problem, aber ich habe bei der Neuerstellung eines RAID5 erhebliche Leistungseinbußen beobachtet (insbesondere beim Schreiben).

verwandte Informationen