RAID 5 com 4 discos não funciona com um disco com falha?

Question 1

Este é um problema fundamental do RAID5 – blocos defeituosos na reconstrução são fatais.

Oct  2 15:08:51 it kernel: [1686185.573233] md/raid:md0: device xvdc operational as raid disk 0
Oct  2 15:08:51 it kernel: [1686185.580020] md/raid:md0: device xvde operational as raid disk 2
Oct  2 15:08:51 it kernel: [1686185.588307] md/raid:md0: device xvdd operational as raid disk 1
Oct  2 15:08:51 it kernel: [1686185.595745] md/raid:md0: allocated 4312kB
Oct  2 15:08:51 it kernel: [1686185.600729] md/raid:md0: raid level 5 active with 3 out of 4 devices, algorithm 2
Oct  2 15:08:51 it kernel: [1686185.608928] md0: detected capacity change from 0 to 2705221484544
⋮

A matriz foi montada, degradada. Ele foi montado com xvdc, xvde e xvdd. Aparentemente, há uma peça sobressalente:

Oct  2 15:08:51 it kernel: [1686185.615772] md: recovery of RAID array md0
Oct  2 15:08:51 it kernel: [1686185.621150] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
Oct  2 15:08:51 it kernel: [1686185.627626] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
Oct  2 15:08:51 it kernel: [1686185.634024]  md0: unknown partition table
Oct  2 15:08:51 it kernel: [1686185.645882] md: using 128k window, over a total of 880605952k.

A mensagem 'tabela de partição' não está relacionada. As outras mensagens informam que o md está tentando fazer uma recuperação, provavelmente em um hot spare (que pode ser o dispositivo que falhou antes, se você tentou removê-lo/adicioná-lo novamente).

⋮
Oct  2 15:24:19 it kernel: [1687112.817845] end_request: I/O error, dev xvde, sector 881423360
Oct  2 15:24:19 it kernel: [1687112.820517] raid5_end_read_request: 1 callbacks suppressed
Oct  2 15:24:19 it kernel: [1687112.821837] md/raid:md0: read error not correctable (sector 881423360 on xvde).
Oct  2 15:24:19 it kernel: [1687112.821837] md/raid:md0: Disk failure on xvde, disabling device.
Oct  2 15:24:19 it kernel: [1687112.821837] md/raid:md0: Operation continuing on 2 devices.

E isso aqui é uma tentativa de ler um setor do xvde (um dos três dispositivos restantes). Isso falha [setor defeituoso, provavelmente] e md (já que a matriz está degradada) não consegue se recuperar. Assim, ele expulsa o disco do array e, com uma falha de disco duplo, seu RAID5 morre.

Não sei por que está sendo rotulado como sobressalente - isso é estranho (embora eu normalmente olhe /proc/mdstat, então talvez seja assim que o mdadm o rotula). Além disso, pensei que os kernels mais novos hesitavam muito mais em eliminar blocos defeituosos - mas talvez você esteja executando algo mais antigo?

O que você pode fazer em relação à isso?

Bons backups. Essa é sempre uma parte importante de qualquer estratégia para manter os dados vivos.

Certifique-se de que a matriz seja limpa rotineiramente em busca de blocos defeituosos. Seu sistema operacional já pode incluir um cron job para isso. Você faz isso ecoando ou repairou checkpara /sys/block/md0/md/sync_action. "Reparar" também reparará quaisquer erros de paridade descobertos (por exemplo, o bit de paridade não corresponde aos dados nos discos).

# echo repair > /sys/block/md0/md/sync_action
#

O progresso pode ser observado com cat /proc/mdstatou com os vários arquivos nesse diretório sysfs. (Você pode encontrar documentação um tanto atualizada noArtigo mdstat do Linux Raid Wiki.

NOTA: Em kernels mais antigos – não tenho certeza da versão exata – a verificação pode não corrigir blocos defeituosos.

Uma última opção é mudar para RAID6. Isso exigirá outro disco (vocêpodeexecutar um RAID6 de quatro ou até três discos, você provavelmente não vai querer). Com kernels novos o suficiente, os blocos defeituosos são corrigidos instantaneamente quando possível. O RAID6 pode sobreviver a duas falhas de disco, portanto, quando um disco falhar, ele ainda poderá sobreviver a um bloco defeituoso – e, portanto, mapeará o bloco defeituoso e continuará a reconstrução.

Answer

Este é um problema fundamental do RAID5 – blocos defeituosos na reconstrução são fatais.

Oct  2 15:08:51 it kernel: [1686185.573233] md/raid:md0: device xvdc operational as raid disk 0
Oct  2 15:08:51 it kernel: [1686185.580020] md/raid:md0: device xvde operational as raid disk 2
Oct  2 15:08:51 it kernel: [1686185.588307] md/raid:md0: device xvdd operational as raid disk 1
Oct  2 15:08:51 it kernel: [1686185.595745] md/raid:md0: allocated 4312kB
Oct  2 15:08:51 it kernel: [1686185.600729] md/raid:md0: raid level 5 active with 3 out of 4 devices, algorithm 2
Oct  2 15:08:51 it kernel: [1686185.608928] md0: detected capacity change from 0 to 2705221484544
⋮

A matriz foi montada, degradada. Ele foi montado com xvdc, xvde e xvdd. Aparentemente, há uma peça sobressalente:

Oct  2 15:08:51 it kernel: [1686185.615772] md: recovery of RAID array md0
Oct  2 15:08:51 it kernel: [1686185.621150] md: minimum _guaranteed_  speed: 1000 KB/sec/disk.
Oct  2 15:08:51 it kernel: [1686185.627626] md: using maximum available idle IO bandwidth (but not more than 200000 KB/sec) for recovery.
Oct  2 15:08:51 it kernel: [1686185.634024]  md0: unknown partition table
Oct  2 15:08:51 it kernel: [1686185.645882] md: using 128k window, over a total of 880605952k.

A mensagem 'tabela de partição' não está relacionada. As outras mensagens informam que o md está tentando fazer uma recuperação, provavelmente em um hot spare (que pode ser o dispositivo que falhou antes, se você tentou removê-lo/adicioná-lo novamente).

⋮
Oct  2 15:24:19 it kernel: [1687112.817845] end_request: I/O error, dev xvde, sector 881423360
Oct  2 15:24:19 it kernel: [1687112.820517] raid5_end_read_request: 1 callbacks suppressed
Oct  2 15:24:19 it kernel: [1687112.821837] md/raid:md0: read error not correctable (sector 881423360 on xvde).
Oct  2 15:24:19 it kernel: [1687112.821837] md/raid:md0: Disk failure on xvde, disabling device.
Oct  2 15:24:19 it kernel: [1687112.821837] md/raid:md0: Operation continuing on 2 devices.

E isso aqui é uma tentativa de ler um setor do xvde (um dos três dispositivos restantes). Isso falha [setor defeituoso, provavelmente] e md (já que a matriz está degradada) não consegue se recuperar. Assim, ele expulsa o disco do array e, com uma falha de disco duplo, seu RAID5 morre.

Não sei por que está sendo rotulado como sobressalente - isso é estranho (embora eu normalmente olhe /proc/mdstat, então talvez seja assim que o mdadm o rotula). Além disso, pensei que os kernels mais novos hesitavam muito mais em eliminar blocos defeituosos - mas talvez você esteja executando algo mais antigo?

O que você pode fazer em relação à isso?

Bons backups. Essa é sempre uma parte importante de qualquer estratégia para manter os dados vivos.

Certifique-se de que a matriz seja limpa rotineiramente em busca de blocos defeituosos. Seu sistema operacional já pode incluir um cron job para isso. Você faz isso ecoando ou repairou checkpara /sys/block/md0/md/sync_action. "Reparar" também reparará quaisquer erros de paridade descobertos (por exemplo, o bit de paridade não corresponde aos dados nos discos).

# echo repair > /sys/block/md0/md/sync_action
#

O progresso pode ser observado com cat /proc/mdstatou com os vários arquivos nesse diretório sysfs. (Você pode encontrar documentação um tanto atualizada noArtigo mdstat do Linux Raid Wiki.

NOTA: Em kernels mais antigos – não tenho certeza da versão exata – a verificação pode não corrigir blocos defeituosos.

Uma última opção é mudar para RAID6. Isso exigirá outro disco (vocêpodeexecutar um RAID6 de quatro ou até três discos, você provavelmente não vai querer). Com kernels novos o suficiente, os blocos defeituosos são corrigidos instantaneamente quando possível. O RAID6 pode sobreviver a duas falhas de disco, portanto, quando um disco falhar, ele ainda poderá sobreviver a um bloco defeituoso – e, portanto, mapeará o bloco defeituoso e continuará a reconstrução.

Question 2

Estou imaginando que você está criando seu array RAID5 assim:

$ mdadm --create /dev/md0 --level=5 --raid-devices=4 \
       /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1

O que não é exatamente o que você quer. Em vez disso, você precisa adicionar os discos assim:

$ mdadm --create /dev/md0 --level=5 --raid-devices=4 \
       /dev/sda1 /dev/sdb1 /dev/sdc1
$ mdadm --add /dev/md0 /dev/sdd1

Ou você pode usar mdadma opção de adicionar peças sobressalentes como esta:

$ mdadm --create /dev/md0 --level=5 --raid-devices=3 --spare-devices=1 \
       /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1

A última unidade da lista será a sobressalente.

trecho dopágina de manual do mdadm

-n, --raid-devices=
      Specify the number of active devices in the array.  This, plus the 
      number of spare devices (see below) must  equal the  number  of  
      component-devices (including "missing" devices) that are listed on 
      the command line for --create. Setting a value of 1 is probably a 
      mistake and so requires that --force be specified first.  A  value 
      of  1  will then be allowed for linear, multipath, RAID0 and RAID1.  
      It is never allowed for RAID4, RAID5 or RAID6. This  number  can only 
      be changed using --grow for RAID1, RAID4, RAID5 and RAID6 arrays, and
      only on kernels which provide the necessary support.

-x, --spare-devices=
      Specify the number of spare (eXtra) devices in the initial array.  
      Spares can also be  added  and  removed  later. The  number  of component
      devices listed on the command line must equal the number of RAID devices 
      plus the number of spare devices.

Answer

Estou imaginando que você está criando seu array RAID5 assim:

$ mdadm --create /dev/md0 --level=5 --raid-devices=4 \
       /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1

O que não é exatamente o que você quer. Em vez disso, você precisa adicionar os discos assim:

$ mdadm --create /dev/md0 --level=5 --raid-devices=4 \
       /dev/sda1 /dev/sdb1 /dev/sdc1
$ mdadm --add /dev/md0 /dev/sdd1

Ou você pode usar mdadma opção de adicionar peças sobressalentes como esta:

$ mdadm --create /dev/md0 --level=5 --raid-devices=3 --spare-devices=1 \
       /dev/sda1 /dev/sdb1 /dev/sdc1 /dev/sdd1

A última unidade da lista será a sobressalente.

trecho dopágina de manual do mdadm

-n, --raid-devices=
      Specify the number of active devices in the array.  This, plus the 
      number of spare devices (see below) must  equal the  number  of  
      component-devices (including "missing" devices) that are listed on 
      the command line for --create. Setting a value of 1 is probably a 
      mistake and so requires that --force be specified first.  A  value 
      of  1  will then be allowed for linear, multipath, RAID0 and RAID1.  
      It is never allowed for RAID4, RAID5 or RAID6. This  number  can only 
      be changed using --grow for RAID1, RAID4, RAID5 and RAID6 arrays, and
      only on kernels which provide the necessary support.

-x, --spare-devices=
      Specify the number of spare (eXtra) devices in the initial array.  
      Spares can also be  added  and  removed  later. The  number  of component
      devices listed on the command line must equal the number of RAID devices 
      plus the number of spare devices.

RAID 5 com 4 discos não funciona com um disco com falha?

Responder1

O que você pode fazer em relação à isso?

Responder2

informação relacionada