Tengo un volumen RAID de software de 3 TB en funcionamiento en Windows 10 en mi máquina de trabajo principal, físicamente dos discos oxidados giratorios de 3 TB. El volumen de arranque es un SSD NVMe independiente. El proceso de resincronización del volumen RAID después de, por ejemplo, un corte de energía requiere alrededor de 5 horas de tiempo ininterrumpido.
Acabo de hacer un experimento simple:
- Reinicie, inicie sesión, verifique que los volúmenes estén sincronizados y apague de manera ordenada. Sé por experiencia pasada que si en este punto reiniciara, iniciara sesión, verificara el estado del volumen, encontraría el RAID sincronizado.
- Desconecte la alimentación de ambas unidades de 3 TB, reinicie, inicie sesión y apague ordenadamente.
- Vuelva a conectar la alimentación a ambas unidades de 3 TB, reinicie, inicie sesión y verifique el estado del volumen.
El proceso de resincronización RAID ha comenzado. Concluyo que el mero hecho de ver ambas unidades desconectadas se registra en el volumen de arranque de Windows en la unidad NVMe y es suficiente para activar una resincronización.
¿Cómo puedo evitar esto? Preferiría hacer algo antes de volver a conectar las unidades, pero estoy dispuesto a hacer algo antes de desconectarlas.
Motivación e informe originales:
A veces quiero hacer cosas con esa PC que sé que es probable que fallen. Ayer estaba revisando el SSD M.2 de un amigo que, resulta, tiene bloques defectuosos que causan una advertencia de BIOS y de alguna manera impiden que Windows arranque, incluso desde otro volumen. Asique
- verifiqué que mi volumen RAID estaba sincronizado, apagué mi máquina
- desconecté los conectores de alimentación de las dos unidades de óxido giratorias, conecté el M.2 defectuoso en un puerto secundario
- intenté iniciar Windows desde mi NVMe en el puerto principal; el cursor estuvo girando durante unos 15 minutos
- conectó una llave USB de Linux, reinició, arrancó desde allí, extrajo datos críticos del SSD M.2 defectuoso
- Apagado, quitó el SSD M.2 defectuoso, volvió a conectar los conectores de alimentación.
- reinicié Windows desde NVMe.
Para mi consternación, comenzó el proceso de resincronización RAID.
Respuesta1
Supongo que las unidades RAID no vieron ningún cambio durante ese proceso, pero incluso debería poder desconectar una unidad de la matriz cuando esté fuera de línea y, por ejemplo, realizar un escaneo de superficie no volátil. Si el proceso de reconstrucción se inicia, algo ha cambiado en una (o tal vez incluso en ambas) de las unidades (lo que podría indicar un deterioro de la salud).
Es posible que desee realizar ese escaneo en cada una de las unidades para ver si todavía están en buen estado. No estoy seguro de si está ejecutando una incursión de software o hardware, pero probablemente lo más seguro sea apagarlo y realizar un escaneo de superficie de cada una de las unidades por separado (¡solo lectura!) usando una herramienta de arranque. Hardware RAID significa que tendrá que cambiar de puerto o cambiar la configuración de RAID a JBOD en la BIOS de la tarjeta.
A más largo plazo, recomendaría encarecidamente dejar atrás RAID. Como habrás notado, el proceso de reconstrucción lleva cada vez más tiempo (creo que fueron alrededor de 36 horas la última vez que usé unidades de 4 TB en una tarjeta RAID Areca). Durante ese período, la otra unidad también podría fallar, ya que probablemente compró esas dos simultáneamente y han visto exactamente el mismo desgaste.
Respuesta2
Verifique que el SSD esté certificado para Windows Server 2016 y Windows Server 2019 usando el catálogo de Windows Server. Pregunte al proveedor si la unidad es compatible con Storage Spaces Direct. Utilice el software de administración de almacenamiento para verificar el estado de las unidades en el almacenamiento. Use el software de administración de almacenamiento para verificar el estado de las unidades en el almacenamiento. Asegúrese de que todos los nodos tengan instaladas las últimas actualizaciones de Windows. Actualice el firmware de la unidad y el almacenamiento si es necesario.