¿Raid 5 con repuesto dinámico o RAID 10 sin repuesto dinámico?

¿Raid 5 con repuesto dinámico o RAID 10 sin repuesto dinámico?

Sí, esta es una de esas preguntas de "haz mi trabajo por mí", ten lástima :)

Estoy en el límite de lo que puedo hacer con la cantidad de discos duros en un servidor sin gastar una cantidad sustancial de dinero. Me quedan cuatro unidades por configurar y puedo configurarlas como RAID 5 y dedicar un repuesto dinámico, o como RAID 10 sin repuesto dinámico. El tamaño de cada uno será el mismo y el RAID 5 ofrecerá suficiente rendimiento.

Soy tímido con RAID 5, pero tampoco me gusta la idea de ejecutarlo sin un repuesto activo. No estoy tan interesado en el rendimiento degradado, sino en la cantidad de tiempo que el sistema pasa sin la redundancia adecuada. El servidor y las unidades tienen un contrato de respuesta de 4 horas 13x5 (aunque sé que el proveedor de servicios más cercano está al menos a 2 o 3 horas en coche en invierno).

Debo señalar que el servidor también tiene dos matrices RAID 1 que también estarían protegidas por el repuesto dinámico. ¿Por qué no fabrican cajas para unidades con 9 bahías? Je.

Respuesta1

¿Cuál es la tolerancia al tiempo de inactividad de la matriz? ¿Está físicamente cerca o en un centro de datos remoto? Básicamente, si puedes tolerarlo, un repuesto frío te permite hacer RAID10. El repuesto está cerca, pero tienes que hacer el cambio físicamente. Si ese no es un escenario aceptable, entonces RAID5 con un repuesto dinámico es la única respuesta que queda.

Dado que ya tiene dos conjuntos RAID1 que tienen tolerancia a fallas de 1 unidad, realmente no gana nada al utilizar RAID10 sin repuesto dinámico. Toda su matriz sólo puede sobrevivir a una falla de una sola unidad.

Respuesta2

Todas estas incursiones son relativas entre sí, suponiendo que se utilicen los mismos discos y controlador en la matriz.

  • Raid5: buena velocidad de lectura, mala velocidad de escritura, puede sobrevivir a cualquier falla de doble disco si las fallas ocurren durante el tiempo suficiente para que la incursión se reconstruya entre fallas. (es decir, el disco falla, la incursión se reconstruye, el disco falla, estás bien). Si tiene fallas simultáneas de dos discos, es SOL a menos que una de las fallas sea el repuesto dinámico. Con una matriz de 4 discos, la mitad de las fallas de doble disco arruinarán su día.

  • Raid6: Buena velocidad de lectura, muy mala velocidad de escritura. Puede sobrevivir a cualquier fallo de doble disco. No se implementa con tanta frecuencia como las otras redadas.

  • Raid10: Buenas velocidades de lectura y escritura, puede sobrevivir a cualquier falla de un solo disco, puede sobrevivir (en el caso de una incursión de 4 discos) a la mitad de posibles fallas de dos discos.

  • espejo de tres vías + repuesto dinámico: mucho menos espacio, puede sobrevivir a cualquier falla de disco doble y falla de hasta 3 discos si las fallas ocurren durante el tiempo suficiente para que el espejo se reconstruya una vez. No estoy seguro de cuántos controladores/sistemas operativos admiten esto, pero era una característica que usaba en Solaris con el MD antes de ZFS.

Hay un par de cuestiones de las que preocuparse al mirar esto:

  1. ¿Cuánto tiempo lleva reconstruir una matriz? Sun comenzó a desarrollar ZFS cuando se dio cuenta de que, en algunas situaciones, el tiempo para reconstruir una matriz raid5 es mayor que el MTBF de los discos de la matriz, lo que prácticamente garantiza que una falla del disco resulte en una falla de la matriz.

  2. Los discos del mismo lote de fabricación pueden tener todos el mismo defecto (o se cayó el palet o pusieron demasiadopegamento en los platos cuando estaban haciendo los discos)

  3. Cuanto más compleja sea la matriz raid, más complejo será el software en el controlador/implementación; He visto tantos controladores raid matar matrices como discos fallidos matan matrices. He visto discos individuales girar durante años y años y años; de hecho, la mayoría lo hace. El sistema más confiable que he tenido fue una caja sin nada redundante en la que nunca fallaba ningún componente. He visto muchos UPS, incursiones y redundancias (insertar componentes aleatorios) que causan fallas porque hicieron que el sistema fuera lo suficientemente complejo como para que la complejidad fuera la fuente de la falla.

Pagas tu dinero, te arriesgas... La pregunta es:

¿Sientes suerte??

Respuesta3

Tendría que estar en desacuerdo con CHopper3. Dado que solo hay 4 unidades en esta situación, sus capacidades de falla son las mismas (2 unidades) en cualquier escenario, excepto con raid 10, si pierde las 2 unidades equivocadas, entonces tendrá un problema real. Definitivamente también existe un beneficio adicional de tener un repuesto global para sus otros RAID.

Respuesta4

También es necesario considerar otras cosas... ¿Qué tan grandes/rápidas son cada una de las unidades? Las unidades SATA de 1 TB podrían tardar una eternidad y un día en reconstruirse a partir del hotspare en un RAID5, dejando una gran ventana abierta a una segunda falla de la unidad.

Usted dice que el rendimiento no es un problema, pero he visto algunos cambios considerables en el rendimiento durante una reconstrucción de RAID5 (especialmente en escrituras).

información relacionada