RAID6が半分故障、まだデータのコピーはできるが、非常に遅い

RAID6が半分故障、まだデータのコピーはできるが、非常に遅い

mdadm セットアップ (2 つのパリティ ドライブ) を備えた 5 ドライブのソフトウェア RAID6 を使用していましたが、ドライブが故障しました。交換品を注文し、故障したドライブを新しいドライブと交換するためにマシンの電源を切ったところ、別のドライブが同時に故障しました (完全に故障)。そのため、現在、データのある古いドライブが 3 つ、再構築中の新しいドライブが 1 つ、失われたドライブが 1 つあります。

その後、再構築が信じられないほど遅く、データのコピー速度が 100 kb/s 程度しかないことに気付きました。以前の再構築では 100 MB/s 程度でした。新しいドライブを搭載した Synology アプライアンスを購入し、できるうちにできるだけ多くのデータをコピーすることにしました。2 か月間稼働しており、数 TB をコピーできましたが、まだ数 TB が残っており、このペースだと完了するまでにさらに 6 か月かかります。

新しい NAS (Synology) に取り込まれるデータは正常で、今のところデータ損失はありません。速度を上げるために何かできることはないかと期待していました。エラー ログには、特定のドライブ (sdd) で障害が発生していることを示していますが、実際には障害が発生していないため、より速くコピーできるように「障害を早くする」ように指示する設定があるのではないでしょうか。ログは次のとおりです。

cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid6 sdf1[5] sdb1[0] sdc1[1] sdd1[2]
      17581168128 blocks super 1.2 level 6, 512k chunk, algorithm 2 [5/3] [UUU__]
      [>....................]  recovery =  0.4% (24696932/5860389376) finish=584364702.6min speed=0K/sec

unused devices: <none>

/var/log/messages の末尾

Dec 16 11:29:47 [localhost] kernel: ata4.00: status: { DRDY ERR }
Dec 16 11:29:47 [localhost] kernel: ata4.00: error: { UNC }
Dec 16 11:29:47 [localhost] kernel: ata4: hard resetting link
Dec 16 11:29:47 [localhost] kernel: ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Dec 16 11:29:47 [localhost] kernel: ata4.00: configured for UDMA/133
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 Sense Key : Medium Error [current] [descriptor]
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 Add. Sense: Unrecovered read error - auto reallocate failed
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 CDB: Read(16) 88 00 00 00 00 00 02 87 64 50 00 00 00 40 00 00
Dec 16 11:29:47 [localhost] kernel: blk_update_request: I/O error, dev sdd, sector 42427472
Dec 16 11:29:47 [localhost] kernel: raid5_end_read_request: 5 callbacks suppressed
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425424 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425432 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425440 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425448 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425456 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425464 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425472 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425480 on sdd1).
Dec 16 11:29:47 [localhost] kernel: ata4: EH complete
Dec 16 11:29:51 [localhost] kernel: ata4.00: exception Emask 0x0 SAct 0x10000000 SErr 0x0 action 0x0
Dec 16 11:29:51 [localhost] kernel: ata4.00: irq_stat 0x40000008
Dec 16 11:29:51 [localhost] kernel: ata4.00: failed command: READ FPDMA QUEUED
Dec 16 11:29:51 [localhost] kernel: ata4.00: cmd 60/38:e0:30:b8:f5/00:00:02:00:00/40 tag 28 ncq 28672 in#012         res 41/40:00:30:b8:f5/00:00:02:00:00/00 Emask 0x409 (media error) <F>

答え1

スーパーユーザーにはこれに似た投稿がいくつかあり、すべて未回答です。最初にボリュームを修正するには、代わりに ddrescue を使用する必要があるため、rsync は問題なく機能します。

https://raid.wiki.kernel.org/index.php/Recovering_a_failed_software_RAID

関連情報