부분적으로 실패한 RAID6, 여전히 데이터를 복사할 수 있지만 엄청나게 느립니다.

2024-7-28 • tag-icon

부분적으로 실패한 RAID6, 여전히 데이터를 복사할 수 있지만 엄청나게 느립니다.

mdadm 설정(패리티 드라이브 2개)이 포함된 5드라이브 소프트웨어 raid6이 있었는데 드라이브 하나에 오류가 발생했습니다. 교체품을 주문했는데 고장난 드라이브를 새 드라이브로 교체하기 위해 컴퓨터 전원을 끄자 다른 드라이브도 동시에 고장났습니다(완전히 작동하지 않음). 이제 데이터가 있는 기존 드라이브 3개, 재구축 중인 새 드라이브 1개, 누락된 드라이브 1개가 있습니다.

그런 다음 재구축이 엄청나게 느리게 진행되고 데이터가 약 100kb/s에 불과하다는 것을 알았습니다. 이전 재구축 속도는 약 100MB/s였습니다! 저는 새 드라이브가 포함된 Synology 장비를 구입하고 가능한 한 많은 데이터를 복사하기로 결정했습니다. 2개월 동안 실행되었으며 몇 TB를 복사할 수 있었지만 아직 몇 TB가 남아 있으며 이 속도라면 완료되기까지 6개월이 더 걸릴 것입니다.

새 NAS(Synology)로 들어오는 데이터는 괜찮습니다. 지금까지 데이터 손실은 없습니다! 나는 그것을 더 빨리 진행시키기 위해 내가 할 수 있는 일이 있기를 바랐다. 오류 로그에는 특정 드라이브(sdd)에서 오류가 발생했음이 표시되지만 실제로는 오류가 발생하지 않기 때문에 더 빠르게 복사할 수 있도록 "빠르게 실패"하도록 지시하는 설정이 있을 수 있습니까? 로그는 다음과 같습니다.

cat /proc/mdstat
Personalities : [raid6] [raid5] [raid4]
md0 : active raid6 sdf1[5] sdb1[0] sdc1[1] sdd1[2]
      17581168128 blocks super 1.2 level 6, 512k chunk, algorithm 2 [5/3] [UUU__]
      [>....................]  recovery =  0.4% (24696932/5860389376) finish=584364702.6min speed=0K/sec

unused devices: <none>

/var/log/messages의 꼬리

Dec 16 11:29:47 [localhost] kernel: ata4.00: status: { DRDY ERR }
Dec 16 11:29:47 [localhost] kernel: ata4.00: error: { UNC }
Dec 16 11:29:47 [localhost] kernel: ata4: hard resetting link
Dec 16 11:29:47 [localhost] kernel: ata4: SATA link up 3.0 Gbps (SStatus 123 SControl 300)
Dec 16 11:29:47 [localhost] kernel: ata4.00: configured for UDMA/133
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 Sense Key : Medium Error [current] [descriptor]
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 Add. Sense: Unrecovered read error - auto reallocate failed
Dec 16 11:29:47 [localhost] kernel: sd 3:0:0:0: [sdd] tag#24 CDB: Read(16) 88 00 00 00 00 00 02 87 64 50 00 00 00 40 00 00
Dec 16 11:29:47 [localhost] kernel: blk_update_request: I/O error, dev sdd, sector 42427472
Dec 16 11:29:47 [localhost] kernel: raid5_end_read_request: 5 callbacks suppressed
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425424 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425432 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425440 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425448 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425456 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425464 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425472 on sdd1).
Dec 16 11:29:47 [localhost] kernel: md/raid:md0: read error not correctable (sector 42425480 on sdd1).
Dec 16 11:29:47 [localhost] kernel: ata4: EH complete
Dec 16 11:29:51 [localhost] kernel: ata4.00: exception Emask 0x0 SAct 0x10000000 SErr 0x0 action 0x0
Dec 16 11:29:51 [localhost] kernel: ata4.00: irq_stat 0x40000008
Dec 16 11:29:51 [localhost] kernel: ata4.00: failed command: READ FPDMA QUEUED
Dec 16 11:29:51 [localhost] kernel: ata4.00: cmd 60/38:e0:30:b8:f5/00:00:02:00:00/40 tag 28 ncq 28672 in#012         res 41/40:00:30:b8:f5/00:00:02:00:00/00 Emask 0x409 (media error) <F>

답변1

그래서 슈퍼유저에 이와 유사한 게시물이 여러 개 있는데 모두 답변이 없습니다. 볼륨을 먼저 수정하려면 대신 ddrescue를 사용해야 하기 때문에 rsync가 괜찮을 것입니다.

https://raid.wiki.kernel.org/index.php/Recovering_a_failed_software_RAID

답변1

관련 정보