Наполовину неисправный RAID6, все еще способный копировать данные, но невероятно медленный

Наполовину неисправный RAID6, все еще способный копировать данные, но невероятно медленный

У меня был 5-дисковый программный raid6 с настройкой mdadm (2 диска четности), и один диск вышел из строя. Я заказал замену, и когда я выключил машину, чтобы заменить неисправный диск на новый, ДРУГОЙ диск вышел из строя в то же самое время (полностью мертвый). Так что теперь есть 3 старых диска с данными, 1 новый, который восстанавливается, и 1 отсутствующий диск.

Затем я заметил, что восстановление идет невероятно медленно, данные справлялись только со скоростью около 100 кб/с. Предыдущие восстановления работали со скоростью около 100 МБ/с! Я решил купить устройство Synology с новыми дисками и скопировать как можно больше данных, пока это было возможно. Оно работает уже 2 месяца, и мне удалось скопировать несколько ТБ, но осталось еще несколько ТБ, и при такой скорости до его завершения пройдет еще 6 месяцев.

Данные, поступающие на новый NAS (Synology), в порядке, пока что нет потерь данных! Я надеялся, что смогу что-то сделать, чтобы ускорить его работу. Журналы ошибок показывают, что он выходит из строя на определенном диске (sdd), но, возможно, есть настройка, которая скажет ему «выходить из строя быстрее», чтобы он копировал быстрее, поскольку на самом деле он не выходит из строя? Журналы ниже:

cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid6 sdf1[5] sdb1[0] sdc1[1] sdd1[2]
      17581168128 blocks super 1.2 level 6, 512k chunk, algorithm 2 [5/3] [UUU__]
      [>....................]  recovery =  0.4% (24696932/5860389376) finish=584364702.6min speed=0K/sec

unused devices: <none>

хвост /var/log/messages

Dec 16 11:29:47 [localhost] kernel: ata4.00: status: { DRDY ERR }
Dec 16 11:29:47 [localhost] kernel: ata4.00: error: { UNC }
Dec 16 11:29:47 [localhost] kernel: ata4: hard resetting link
Dec 16 11:29:47 [localhost] kernel: ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Dec 16 11:29:47 [localhost] kernel: ata4.00: configured for UDMA/133
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 Sense Key : Medium Error [current] [descriptor]
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 Add. Sense: Unrecovered read error - auto reallocate failed
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 CDB: Read(16) 88 00 00 00 00 00 02 87 64 50 00 00 00 40 00 00
Dec 16 11:29:47 [localhost] kernel: blk_update_request: I/O error, dev sdd, sector 42427472
Dec 16 11:29:47 [localhost] kernel: raid5_end_read_request: 5 callbacks suppressed
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425424 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425432 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425440 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425448 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425456 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425464 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425472 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425480 on sdd1).
Dec 16 11:29:47 [localhost] kernel: ata4: EH complete
Dec 16 11:29:51 [localhost] kernel: ata4.00: exception Emask 0x0 SAct 0x10000000 SErr 0x0 action 0x0
Dec 16 11:29:51 [localhost] kernel: ata4.00: irq_stat 0x40000008
Dec 16 11:29:51 [localhost] kernel: ata4.00: failed command: READ FPDMA QUEUED
Dec 16 11:29:51 [localhost] kernel: ata4.00: cmd 60/38:e0:30:b8:f5/00:00:02:00:00/40 tag 28 ncq 28672 in#012         res 41/40:00:30:b8:f5/00:00:02:00:00/00 Emask 0x409 (media error) <F>

решение1

Итак, есть несколько постов на superuser, которые похожи на этот, и все они без ответа. Это потому, что вам следует использовать ddrescue вместо этого, чтобы сначала исправить громкость, затем rsync будет в порядке.

https://raid.wiki.kernel.org/index.php/Восстановление_сбойного_программного_RAID

Связанный контент