Eu tenho uma partição ext4 com a seguinte pilha subjacente:
- sda1 e sdb1 estão juntos em um RAID1, resultando em md0
- md0 é criptografado por LUKS, resultando em md0_crypt
- no topo de md0_crypt está um único volume LVM mv0_vg_media, montado em /home/media
Ao executar, cp /home/media/hierarchy/photo.jpg /tmp
recebo um erro de IO (mas apenas para 20 arquivos, entre dezenas de milhares).
Hoever, quando tento depurar o problema:
- Tanto o dmesg quanto o syslog permanecem limpos quando ocorre o erro IO. (EDIT: esclarecimento: isso significa que não há nenhuma saída relacionada ao disco registrada no dmesg ou syslog, mesmo que o log esteja ativo com a
--follow
opção enquanto ocorrem erros de leitura.) - Badblocks em sda e sdb não revelam erros
- fsck
/dev/mapper/md0_vg_media
apenas nas saídas "poderia ser mais restrito. IGNORADO." avisos, mas sem erros e a opção de correção automática não corrige nada.
Estou confuso. Eu poderia simplesmente excluir esses arquivos e sincronizá-los novamente, mas é uma má ideia se eu não souber qual é realmente o problema.
Como posso depurar ainda mais isso?
EDITAR:
A partir dos comentários e de pesquisas adicionais, tentei as seguintes abordagens (em vão) com os seguintes resultados:
mdadm --examine /dev/sda
(o mesmo para sdb) retorna:/dev/sda: MBR Magic : aa55 Partition[0] : 3907029167 sectors at 1 (type ee)
mdadm --examine-badblocks /dev/sda
(o mesmo para sdb) retorna:mdadm: mbr metadata does not support badblocks
cat /sys/block/md0/md/mismatch_cnt
contém o valor0
(zero)echo 'check' > /sys/block/md0/md/sync_action
executa a verificação, mas não revela nenhum erro. Dmesg tem duas entradas:[734796.807172] md: data-check of RAID array md0
e imediatamente abaixo:[754370.977181] md: md0: data-check done.