¿Dónde se almacenan los metadatos de los bloques en RAID?

¿Dónde se almacenan los metadatos de los bloques en RAID?

Estoy muy emocionado de saber sobre los centros de datos, luego me encontré con los sistemas RAID.

Mis preguntas pueden ser muy tontas, por favor tengan paciencia conmigo.

Generalmente en cualquier nivel RAID> 0, por ejemplo: RAID 5 ¿Cómo sabe el sistema operativo que los fragmentos de un archivo se encuentran en qué disco y en qué bloque?

¿Qué metadatos se almacenarán para un archivo determinado?

Si realmente almacena los metadatos sobre los archivos... ¿Dónde se almacenan físicamente estos metadatos (y en qué disco se almacenan)?

Como dicen, RAID 5 puede admitir 1 falla de disco, pero si falla el disco que contiene los metadatos, entonces todo se desperdicia, ¿verdad?

Quería saber el ciclo de vida de un archivo que se almacenará en RAID 5, cómo funciona la actualización y cómo funciona la eliminación de un archivo.

¿Cada bloque contiene información de un solo archivo o de varios archivos?

¿Puedo llegar a la conclusión de que a medida que aumenta el nivel de RAID, aumenta el paralelismo de lectura y disminuye el rendimiento de escritura?

Respuesta1

¿Qué metadatos se almacenarán para un archivo determinado?

RAID no tiene absolutamente nada que ver conarchivometadatos. Es puramente undiscodisposición y como tal simplemente hace una traducción de dirección de disco a bloque físico.

Los metadatos de archivos son puramente una cuestión del sistema de archivos y un sistema de archivos se encuentra encima de una partición en un disco. Hay varias capas de traducción entre un archivo y un bloque de disco. En lo que respecta a un controlador de disco (el controlador RAID), en el momento en que se le proporcionan datos pertenecientes a un "archivo", el sistema de archivos y los controladores de disco lógicos del sistema operativo ya lo han reducido para "escribir este bloque de datos en el bloque del disco". número X".

RAID organizará los discos de una manera lógica precisa. El controlador conoce detalles como el número de discos, el tamaño de la banda y el orden de la banda de discos y, dados esos detalles, cualquierlógicoLa dirección de bloque que le pasa el sistema operativo se puede calcular y asignar al "disco 2, ubicación Y", etc.

Como dicen, RAID 5 puede admitir 1 falla de disco, pero si falla el disco que contiene los metadatos, entonces todo se desperdicia, ¿verdad?

No. RAID 5 contiene 1 disco (valor de datos), que es una suma lógica de los otros discos. Siempre tienes 1 copia completa de todos los datosmásmetadatos que equivalen a una suma combinada de los otros 3 discos.

Disk1 block + disk2 block + disk3 block = redundant (disk4) block

Si falla una unidad, puede reorganizar la suma para obtener

Disk1 block + disk2 block + disk4 (redundant) block = disk3 block

De esta manera obtienes cierto nivel de tolerancia a fallos repartido entre tus discos. Si falla algún disco aleatorio, aún tendrá acceso a suficientes datos para reemplazar ese disco. Es de esperar que reemplace ese disco antes de que falle otro y pueda reconstruir los datos faltantes para restaurar completamente la tolerancia a fallas.

Las matemáticas detrás del bloque redundante merecen un artículo propio y te recomendaría que leas elPágina de Wikipedia sobre RAIDmatrices para tener una mejor idea de ello.

Quería saber el ciclo de vida de un archivo que se almacenará en RAID 5, cómo funciona la actualización y cómo funciona la eliminación de un archivo.

¿Cada bloque contiene información de un solo archivo o de varios archivos?

Los archivos son una construcción del sistema de archivos y son manejados por su sistema operativo. RAID se ocupa exclusivamente de los discos y no sabe nada de archivos.

Un bloque de disco puede contener cualquier cantidad de archivos; depende totalmente del sistema operativo colocar los datos en bloques en el disco.

El controlador RAID simplemente presenta una interfaz de disco al sistema operativo, el sistema operativo escribe bloques en él. Lo que haya en esos bloques depende del sistema operativo.

¿Puedo llegar a la conclusión de que a medida que aumenta el nivel de RAID, aumenta el paralelismo de lectura y disminuye el rendimiento de escritura?

Sí, hasta cierto punto, depende del nivel de RAID utilizado y el rendimiento de escritura no necesariamente disminuye a medida que aumenta el rendimiento de lectura. El rendimiento de escritura puede ser (digamos) 3/4 del rendimiento de lectura dependiendo de la tarea.

DeWikipedia

En comparación con RAID 4, la paridad distribuida de RAID 5 nivela la tensión de un disco de paridad dedicado entre todos los miembros de RAID. Además, el rendimiento de escritura aumenta ya que todos los miembros de RAID participan en la atención de las solicitudes de escritura. Aunque no será tan eficiente como una configuración de segmentación (RAID 0), debido a que aún se debe escribir la paridad, esto ya no es un cuello de botella.

Dado que el cálculo de paridad se realiza en la franja completa, los pequeños cambios en la experiencia de la matriz escriben amplificación:en el peor de los casos, cuando se va a escribir un único sector lógico, es necesario leer el sector original y el sector de paridad correspondiente, los datos originales se eliminan de la paridad, los nuevos datos se calculan en la paridad y ambos en el nuevo sector de datos. y el nuevo sector de paridad se escriben.

información relacionada