mdadm - 소프트웨어 공격대

mdadm - 소프트웨어 공격대

저는 소규모 RAID 기반 Ubuntu 11.04 서버 시스템을 설정했고 방금 이 이메일을 받았습니다. 이것을 어떻게 확인하거나 확인할 수 있나요?

리차드

이것은 godzilla에서 실행 중인 mdadm에서 자동으로 생성된 메일 메시지입니다.

md 장치 /dev/md/0에서 실패 이벤트가 감지되었습니다.

구성요소 장치 /dev/sda1과 관련이 있을 수 있습니다.

충실히 당신의 것 등

PS /proc/mdstat 파일에는 현재 다음이 포함되어 있습니다.

성격: [선형] [다중 경로] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : 활성 raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 블록 슈퍼 1.2 레벨 5, 512k 청크, 알고리즘 2 [4/3] [_UUU] [>.................] 검사 = 2.2% (21655188/975711744) 완료=4419.8분 속도 =3597K/초

&> 고양이 /proc/mdstat성격: [선형] [다중 경로] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : 활성 raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 블록 슈퍼 1.2 레벨 5, 512k 청크, 알고리즘 2 [4/3] [_UUU]

사용하지 않는 장치:

고양이 /proc/mdstat성격 : [선형] [다중 경로] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0 : 활성 raid5sda1[0]에프sdb1[1]sdd1[3] sdc1[2] 2927135232 블록 슈퍼 1.2 레벨 5, 512k 청크, 알고리즘 2 [4/3] [_UUU]

사용하지 않는 장치:

메시지 [775549.274966] md/raid:md0: sda1의 디스크 오류로 인해 장치가 비활성화되었습니다. [775549.274967] md/raid:md0: 3개 장치에서 작업이 계속됩니다. [775549.280021] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310408
). [775549.280028] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310416
). [775549.280031] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310424
). [775549.280035] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310432
). [775549.280039] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310440
). [775549.280043] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310448
). [775549.280047] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310456
). [775549.280051] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310464
). [775549.280055] md/raid:md0: 읽기 오류를 수정할 수 없습니다(sda1의 섹터 43310472
). [775549.280226] ata7: EH 완료 [775549.316567] ata7.00: 예외 Emask 0x0 SAct 0x0 SErr 0x300000 작업 0x6 [775549.319133] ata7.00: BMDMA stat 0x45 [775549.321658] 7: SError: { Dispar BadCRC } [775549.324237] ata7.00 : 실패한 명령: READ DMA EXT [775549.326754] ata7.00: cmd 25/00:f8:28:ed:94/00:03:02:00:00/e0 태그 0 dma 52019
2 in [775549.326757] res 51/ 84:48:78:7f:2e/84:00:03:00:00/e0 Emask 0x10(ATA
버스 오류) [775549.331806] ata7.00: 상태: { DRDY ERR } [775549.334350] ata7.00: 오류: { ICRC ABRT } [775549.336890] ata7: 하드 재설정 링크 [775549.336895] ata7: nv: 점유된 포트에서 하드 재설정 건너뛰기 [775549.340260] md: md0: 데이터 확인이 완료되었습니다. [775549.804062] ata7: SATA 링크 최대 3.0Gbps(SStatus 123 SControl 300) [775549.844352] ata7.00: UDMA/33용으로 구성됨 [775549.844390] ata7: EH 완료 [775549.936450] RAID conf 인쇄물: [775549. 936456] --- 레벨: 5 rd:4 wd:3 [775549.936460] 디스크 0, o:0, dev:sda1 [775549.936463] 디스크 1, o:1, dev:sdb1 [775549.936465] 디스크 2, o:1, dev:sdc1 [775549.936507] 디스크 3, o:1, dev:sdd1 [775549.936557] RAID conf printout: [775549.936559] --- level:5 rd:4 wd:3 [775549.936562] 디스크 1, o:1, dev:sdb1 [775549.936564] 디스크 2, o:1, dev:sdc1 [775549.936567] 디스크 3, o:1, dev:sdd1

sudo mdadm --detail /dev/md0

/dev/md0: 버전 : 1.2 생성 시간 : Sat Jan 1 14:43:44 2005 Raid Level : raid5 어레이 크기 : 2927135232 (2791.53 GiB 2997.39 GB) 사용된 개발 크기 : 975711744 (930.51 GiB 999.13 GB) Raid 장치 : 총 4개 장치: 4 지속성: 슈퍼블록은 지속성입니다.

Update Time : Sun Feb  5 19:17:41 2012
      State : clean, degraded  Active Devices : 3 Working Devices : 3  Failed Devices : 1   Spare Devices : 0

     Layout : left-symmetric
 Chunk Size : 512K

       Name : godzilla:0  (local to host godzilla)
       UUID : 7c2be5e4:25e338e5:b575b8cd:83896caf
     Events : 657

Number   Major   Minor   RaidDevice State
   0       0        0        0      removed
   1       8       17        1      active sync   /dev/sdb1
   2       8       33        2      active sync   /dev/sdc1
   3       8       49        3      active sync   /dev/sdd1

   0       8        1        -      faulty spare   /dev/sda1

답변1

'dmesg'의 출력과 /var/log/syslog 파일을 살펴보겠습니다. /dev/sda1의 문제에 관한 힌트가 있을 수 있습니다.

하드 디스크가 손상되었을 수도 있지만 케이블이 제대로 연결되지 않았기 때문일 수도 있습니다(SATA 케이블은... 그다지 훌륭하지 않습니다). 장치가 아직 온라인 상태인지 확인하세요. /dev/sde1과 같은 다른 이름이나 시스템의 다음 사용 가능한 이름을 사용하여 사용할 수 있습니다. 언급했듯이 dmesg/syslog, SMART도 확인하겠습니다. 케이블을 제대로 연결해야 하거나 교체해야 할 수도 있습니다. 대부분의 경우 RAID 어레이에 디스크를 다시 추가할 수 있습니다. 문제가 실제로 손상된 케이블이나 이와 유사한 것과 관련된 경우, 즉 "실제" 하드 디스크 오류가 아닌 경우에만 해당 명령을 사용하겠습니다.

mdadm --fail /dev/mdX /dev/sdX # set the disk faulty
mdadm -r /dev/mdX /dev/sdX # remove faulty disk
mdadm --re-add /dev/mdX /dev/sdX # re-add disk

면책조항: 보장할 수 없습니다. 백업이 있어야 하며 이렇게 하면 RAID 어레이가 재구축됩니다. 그 동안에는 중복성이 없습니다.

관련 정보