¿Cuáles son los riesgos de tener un RAID1 "desequilibrado"?

¿Cuáles son los riesgos de tener un RAID1 "desequilibrado"?

Contexto: Tengo un servidor con dos unidades NAS de 3 TB en un RAID1 (Linux dmraid) y estoy buscando duplicar la capacidad de almacenamiento, pero solo tengo una bahía de unidad libre. Podría comprar dos unidades de 6 TB, pero pensé que podría salirme con la mía comprando solo una y remodelando la matriz para que fuera:

  • RAID1 de 6 TB
    • Disco de 6 TB (nuevo)
    • RAID0 de 6 TB
      • Disco de 3TB (existente)
      • Disco de 3TB (existente)

No me preocupa el proceso de remodelación, ya que debería ser bastante sencillo:

  1. Haga una copia de seguridad del contenido, por supuesto.
  2. Aumente el RAID1 existente a 3 dispositivos agregando el disco de 6 TB.
  3. Espere a que se complete la resincronización.
  4. Falle los dos dispositivos de 3 TB fuera de la matriz. (La matriz se degrada).
  5. Reduzca la matriz a 2 dispositivos.
  6. Cree el RAID0 en los dos dispositivos de 3TB.
  7. Agregue el RAID0 como segundo dispositivo al RAID1.
  8. El RAID1 se resincroniza y ya no se degrada.
  9. Cambie el tamaño del RAID1, aumentándolo de 3 TB a 6 TB.

Todo esto debería poder hacerse en línea.

Sin embargo, quiero asegurarme de que esto seacuerdo. Todas las unidades serían del mismo fabricante y serie (WD Red). El rendimiento me preocupa menos que la fiabilidad.

¿Qué problemas puedo encontrar?operación y mantenimientotal conjunto? (No estoy preguntando sobre el proceso de migración/remodelación; me siento bastante cómodo con ese procedimiento).

¿Habría una ventaja de rendimiento o confiabilidad al tener un dispositivo RAID1 (el disco de 6 TB o el RAID0 de 3 TB+3 TB) marcado como de escritura mayoritaria? Por ejemplo, dado que RAID0 contiene unidades más antiguas, ¿la escritura principalmente en el dispositivo RAID0 extendería la vida útil de esas unidades?

Respuesta1

tl;dr: Asegúrese de que esas unidades más pequeñas sean extra confiables.

Estaría haciendo como el antiguo metadisco SunOS, con actualizaciones interesantes, cuando las unidades SCSI eran prohibitivamente $$$. ;) Si las unidades son del mismo fabricante tiene poco o ningún impacto en lo que le importa al sistema operativo. Es bueno estandarizar en un modelo exacto, origen de fábrica y velocidad de la placa porque luego las placas del controlador se pueden intercambiar en caso de que una placa se apague. (Si tiene una caja limpia como Louis Rossmann, incluso puede intercambiar platos entre unidades).

Pf = probabilidad de falla

D# = número de disco #

La confiabilidad de RAID0 es Pf(D0) * Pf(D1)

La confiabilidad de RAID1 es 1 - (1 - Pf(D0)) * (1 - Pf(D1))

Lo que conduce a un Pf general = 1 - (1 - Pf(D0)) * (1 - Pf(D10)*Pf(D11))

Para referencia futura, consulte el blog de BackBlaze para conocer los modelos de unidades actuales específicos y muy confiables para obtener unidades de calidad a un precio relativamente económico y mantenerse alejado de unidades problemáticas. Existen unidades para "consumidores minoristas" con MTTF/MTBF demostrablemente mejores que las unidades empresariales, y también son mucho más baratas.

Referencias

http://www.eventhelix.com/RealtimeMantra/FaultHandling/system_reliability_availability.htm#.W5deNaRlCEc

https://www.backblaze.com/blog/

Respuesta2

Lo que está haciendo es exactamente lo que hicimos nosotros en nuestra (pequeña) empresa. Aumentamos el tamaño de nuestra matriz RAID1 de 1 TB inicial a 4 TB de manera similar a lo que usted describe, inicialmente comprando una o dos unidades más grandes y luego completando la nueva matriz grande con unidades más grandes a medida que algunas de las más pequeñas se eliminaron del debido a una falla o porque eran necesarios para reemplazar otras unidades fallidas (incluso más pequeñas) en otras PC de la empresa.

No estamos demasiado preocupados por el rendimiento y hemos visto un rendimiento diferente durante esos años, así que no puedo hablar de eso.

Estamos más preocupados por la confiabilidad (como usted), y puedo decirle que nuestra matriz RAID es una matriz 3-RAID1, además de un repuesto externo que se resincroniza todos los días y se intercambia con una de las unidades 3-RAID1. El repuesto externo es para recuperación ante desastres: en caso de que algún evento destruya todas las unidades del array, podemos comenzar inmediatamente con los datos del día anterior.

Con un RAID1 de 2 unidades, debe preocuparse por el tiempo de resincronización necesario cuando instala una unidad nueva para reemplazar una que falla, que puede ser de varias horas para una matriz de 6 TB. Te quedas con la confiabilidad de un solo disco durante esas horas. Con esas unidades grandes, creo que es mejor tener al menos un RAID1 de 3 unidades.

información relacionada