
Estou muito animado para saber sobre data centers, então me deparei com sistemas RAID.
Minhas perguntas podem ser muito bobas, por favor, tenha paciência comigo.
Geralmente em qualquer nível de RAID> 0, Ex: RAID 5 Como o sistema operacional sabe que os pedaços de um arquivo estão localizados em qual disco e em qual bloco?
Quais metadados serão armazenados para um determinado arquivo?
Se ele realmente armazena os metadados sobre os arquivos. Onde esses metadados são armazenados fisicamente (e em qual disco eles armazenam)?
Como se costuma dizer, o RAID 5 pode suportar 1 falha de disco, mas se o disco que contém os metadados falhar, tudo será desperdiçado, certo?
Queria saber o ciclo de vida de um arquivo que vai ser armazenado no RAID 5 e como funciona a atualização e como funciona a exclusão de um arquivo?
Cada bloco contém informações de um único arquivo ou de vários arquivos?
Posso chegar à conclusão de que, à medida que o nível do RAID aumenta, o paralelismo de leitura aumenta e o desempenho de gravação diminui?
Responder1
Quais metadados serão armazenados para um determinado arquivo?
RAID não tem absolutamente nada a ver comarquivometadados. É puramente umdiscoarranjo e, como tal, apenas faz um endereço de disco para tradução de bloco físico.
Os metadados do arquivo são puramente uma coisa do sistema de arquivos e um sistema de arquivos fica no topo de uma partição de um disco. Existem várias camadas de tradução entre um arquivo e um bloco de disco. No que diz respeito a um controlador de disco (o controlador RAID), no momento em que recebe dados pertencentes a um "arquivo", ele já foi reduzido pelos drivers de disco lógico do sistema de arquivos e do sistema operacional para "escrever este bloco de dados no bloco de disco número X".
O RAID organizará os discos de maneira lógica e precisa. O controlador conhece detalhes como número de discos, tamanho da faixa e ordem da faixa de disco e fornece esses detalheslógicoo endereço do bloco passado a ele pelo sistema operacional pode ser calculado e mapeado para o "disco 2, local Y" ou assim por diante.
Como se costuma dizer, o RAID 5 pode suportar 1 falha de disco, mas se o disco que contém os metadados falhar, tudo será desperdiçado, certo?
Não. O RAID 5 contém 1 disco (valor de dados), que é uma soma lógica dos outros discos. Você sempre tem 1 cópia completa de todos os dadosmaismetadados que equivalem a uma soma combinada dos outros 3 discos.
Disk1 block + disk2 block + disk3 block = redundant (disk4) block
Se uma unidade falhar, você pode reorganizar a soma para fornecer
Disk1 block + disk2 block + disk4 (redundant) block = disk3 block
Assim, você obtém algum nível de tolerância a falhas espalhado pelos discos. Caso algum disco aleatório falhe, você ainda terá acesso a dados suficientes para substituir esse disco. Esperamos que você substitua esse disco antes que outro falhe e possa reconstruir os dados ausentes para restaurar totalmente a tolerância a falhas.
A matemática por trás do bloco redundante vale um artigo próprio e eu recomendo que você leia oPágina da Wikipédia sobre RAIDmatrizes para ter uma ideia melhor disso.
Queria saber o ciclo de vida de um arquivo que vai ser armazenado no RAID 5 e como funciona a atualização e como funciona a exclusão de um arquivo?
Cada bloco contém informações de um único arquivo ou de vários arquivos?
Os arquivos são uma construção do sistema de arquivos e são gerenciados pelo seu sistema operacional. O RAID se preocupa inteiramente com discos e não sabe nada sobre arquivos.
Um bloco de disco pode conter qualquer número de arquivos; cabe inteiramente ao sistema operacional colocar os dados em blocos no disco.
O controlador RAID simplesmente apresenta uma interface de disco para o sistema operacional, o sistema operacional grava blocos nele. O que está nesses blocos depende do sistema operacional.
Posso chegar à conclusão de que, à medida que o nível do RAID aumenta, o paralelismo de leitura aumenta e o desempenho de gravação diminui?
Sim, até certo ponto, depende do nível de RAID usado e o desempenho de gravação não diminui necessariamente com o aumento do desempenho de leitura. O desempenho de gravação pode ser (digamos) 3/4 do desempenho de leitura, dependendo da tarefa.
Em comparação com o RAID 4, a paridade distribuída do RAID 5 equilibra o estresse de um disco de paridade dedicado entre todos os membros do RAID. Além disso, o desempenho de gravação aumenta, pois todos os membros do RAID participam do atendimento das solicitações de gravação. Embora não seja tão eficiente quanto uma configuração de striping (RAID 0), porque a paridade ainda deve ser escrita, isso não é mais um gargalo.
Como o cálculo de paridade é realizado em toda a faixa, pequenas alterações na matriz experimentam amplificação de gravação:na pior das hipóteses, quando um único setor lógico deve ser escrito, o setor original e o setor de paridade correspondente precisam ser lidos, os dados originais são removidos da paridade, os novos dados são calculados na paridade e ambos os novos setores de dados e o novo setor de paridade estão escritos.