RAID-0 SSD 오류: I/O 오류, err_mask=0x4

RAID-0 SSD 오류: I/O 오류, err_mask=0x4

설정

나는 가지고있다아수스 UX301LA-DE022H. 2개가 들어있어요SSD 샌디스크 SD6SP1M-256G-1102, 각각 256G, Intel 펌웨어 RAID 0(가짜 RAID라고도 함)으로 구성됩니다.

무슨 일이에요

저는 평소에 Windows를 사용하고 있었습니다. 몇 분 동안 나갔다가 다시 돌아왔을 때 PC에 검은색 화면이 표시되고 부팅 옵션 없이 UEFI 구성 화면으로만 부팅되었습니다.

따라서 PC는 어떠한 충격이나 물리적 손상도 겪지 않았습니다. 이 시점에서는 지저분한 Windows 업데이트나 소프트웨어/물리적 드라이브 오류가 의심됩니다.

간단히 말해서

SSD 중 하나가 더 이상 감지되지 않아 전체 RAID 0 디스크가 유효하지 않게 됩니다. 가장 관련성이 높은 오류는 dmesg입니다 failed to IDENTIFY (I/O error, err_mask=0x4).

문제는 무엇입니까? 물리적인 실패인가요? 실패할 가능성이 가장 높은 구성 요소는 무엇입니까? 이 경우 어떤 전자 부품이 고장났는지 궁금합니다.

데이터 복구 회사는 데이터 복구를 어떻게 진행합니까? SSD 컨트롤러를 교체할까요? 그들은 죽은 저항기를 찾을 것인가?


아래에서 모든 세부 정보를 찾아보세요.

조사

  • 컴퓨터가 UEFI 구성 화면을 표시하는 데 120초가 걸립니다.
  • UEFI 구성 화면에서 사용할 수 있는 부팅 옵션이 없습니다.
  • 하나의 SSD가 작동합니다(하지만 RAID 0의 절반에 불과합니다!).

    • Linux USB 스틱에서 부팅하는 동안 감지되었습니다.

      > dmesg|grep ata2
      [    3.590698] ata2: SATA max UDMA/133 abar m2048@0xf7d22000 port 0xf7d22180 irq 43
      [   51.454606] ata2: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
      [   51.455389] ata2.00: ACPI cmd ef/10:09:00:00:00:b0 (SET FEATURES) succeeded
      [   51.456504] ata2.00: ATA-8: SanDisk SD6SP1M256G1102, X231302, max UDMA/133
      [   51.456510] ata2.00: 500118192 sectors, multi 1: LBA48 NCQ (depth 31/32), AA
      [   51.457752] ata2.00: ACPI cmd ef/10:09:00:00:00:b0 (SET FEATURES) succeeded
      [   51.459283] ata2.00: configured for UDMA/133
      
    • SSD가 단독으로 있는 경우에는 문제없이 PC가 바로 시작됩니다.

    • SSD 자체가 UEFI 구성에 의해 올바르게 감지됩니다.

SSD 작동 UEFI

  • 하나의 SSD가 작동하지 않습니다:

    • Linux USB 스틱에서 부팅하는 동안 감지되지 않습니다.

      > dmesg|grep ata1
      [    3.590697] ata1: SATA max UDMA/133 abar m2048@0xf7d22000 port 0xf7d22100 irq 43
      [    3.904513] ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
      [    9.013343] ata1.00: qc timeout (cmd 0xec)
      [    9.013356] ata1.00: failed to IDENTIFY (I/O error, err_mask=0x4)
      [    9.327983] ata1: SATA link up 6.0 Gbps (SStatus 133 SControl 300)
      [   19.466671] ata1.00: qc timeout (cmd 0xec)
      [   19.466683] ata1.00: failed to IDENTIFY (I/O error, err_mask=0x4)
      [   19.466690] ata1: limiting SATA link speed to 3.0 Gbps
      [   19.781305] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
      [   50.826666] ata1.00: qc timeout (cmd 0xec)
      [   50.826678] ata1.00: failed to IDENTIFY (I/O error, err_mask=0x4)
      [   51.141298] ata1: SATA link up 3.0 Gbps (SStatus 123 SControl 320)
      
    • SSD가 단독으로 작동하면 PC가 느리게 시작됩니다.

    • SSD 자체가 UEFI 구성에 의해 잘못 감지됩니다.

SSD가 작동하지 않음-uefi

  • 두 SATA 포트 모두 정상입니다. 각 포트에서 SSD 기능을 사용해 보았는데 정확하고 빠르게 감지되었습니다.
  • 두 SSD가 모두 있으면 UEFI 구성 화면에 두 디스크가 모두 표시됩니다. 마지막 점은 저를 당황하게 합니다. PC가 두 개의 SSD가 있다는 것을 알 수 있지만 그 중 하나에 연결하려고 하면 시간이 초과되는 것 같습니다.

SSD 모두

  • 두 SSD 모두 시각적 손상이 없음

SSD-1 SSD-2

추가 정보(관련 부분만 표시):

> blkid
/dev/sdb: TYPE="isw_raid_member"

> lsscsi -L
[1:0:0:0]    disk    ATA      SanDisk SD6SP1M2 302   /dev/sdb
  device_blocked=0
  iocounterbits=32
  iodone_cnt=0x6d
  ioerr_cnt=0x2
  iorequest_cnt=0x6d
  queue_depth=31
  queue_type=simple
  scsi_level=6
  state=running
  timeout=30
  type=0

> smartctl -iA /dev/sdb
smartctl 6.6 2017-11-05 r4594 [x86_64-linux-4.14.15-1-ARCH] (local build)
Copyright (C) 2002-17, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     SanDisk SD6SP1M256G1102
Serial Number:    141196400698
LU WWN Device Id: 5 001b44 beb8b143a
Firmware Version: X231302
User Capacity:    256,060,514,304 bytes [256 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      Unknown (0x0010)
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ATA8-ACS T13/1699-D revision 6
SATA Version is:  SATA 3.0, 6.0 Gb/s (current: 6.0 Gb/s)
Local Time is:    Sun Jul 22 03:01:37 2018 UTC
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 4
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  5 Reallocated_Sector_Ct   0x0032   100   100   ---    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   253   100   ---    Old_age   Always       -       3184
 12 Power_Cycle_Count       0x0032   100   100   ---    Old_age   Always       -       16004
166 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       1
167 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       19
168 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       117
169 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       379
171 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       0
172 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       0
173 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       27
174 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       39
187 Reported_Uncorrect      0x0032   100   100   ---    Old_age   Always       -       0
194 Temperature_Celsius     0x0022   058   047   ---    Old_age   Always       -       42 (Min/Max 18/47)
212 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       0
230 Unknown_SSD_Attribute   0x0032   100   100   ---    Old_age   Always       -       90
232 Available_Reservd_Space 0x0033   100   100   004    Pre-fail  Always       -       100
233 Media_Wearout_Indicator 0x0032   100   100   ---    Old_age   Always       -       7187
241 Total_LBAs_Written      0x0030   253   253   ---    Old_age   Offline      -       1266
242 Total_LBAs_Read         0x0030   253   253   ---    Old_age   Offline      -       1203
243 Unknown_Attribute       0x0032   100   100   ---    Old_age   Always       -       0

dmidecode, 및 같은 기타 Linux 명령은 fdisk더 많은 관련 정보를 제공하지 않았습니다.lsblklspci

주의: 다음과 같은 관련 질문을 찾았습니다.부팅 드라이브였던 Raid-0의 SSD 1개에 오류가 발생하여 컴퓨터 부팅이 중단됨그리고누락된 RAID1 드라이브를 수정하는 방법그러나 시작 시 RAID 구성 화면에 액세스할 수 없었습니다.

가능하다면 해당 디스크에서 데이터를 검색하고 싶습니다. 이 시점에서는 데이터를 스크래치하고 남은 디스크를 단일 디스크로 바꾸는 데 관심이 없습니다. 결국 데이터복구업체에 문의하게 되는데 무엇이 문제인지, 혹시 제가 할 수 있는 조치가 있는지 알고 싶습니다.

참고하세요간단히 말해서질문에 대한 섹션입니다.

답변1

이것은 커널 버그입니다. 저는 커널 5.10과 함께 debian 11을 사용하고 있으며 동일한 문제가 있습니다. 커널 5.18로 업그레이드하면 문제가 사라졌습니다.

관련 정보