HDDは起動/再起動後数時間しか動作しない

HDDは起動/再起動後数時間しか動作しない

RAID 0 アレイ内の 3 台の HDD (Western Digitial WD3003FZEX ブラック 3TB SATA 6GB/S 7200RPM 64MB キャッシュ 3.5 インチ ハード ドライブ) のうち 1 台が故障しました。最初は OS から消えます。その後、ケーブルを再接続すると再び表示されますが、安定しません。

起動/再起動後数時間は動作し、mdadm はシリアル番号を読み取り、ddrescue は平均速度 2 MB/秒で約 90 GB のデータを読み出します。問題が発生した後、シリアル番号は空になり、ddrescue は読み取りに成功せずに 0 バイトを読み取ります。

I/O Controller : /sys/devices/pci0000:00/0000:00:1f.2 (SATA)
          Port2 : /dev/sdd (WD-WMC5D0D9X6D8)
          Port3 : /dev/sde (WD-WMC1F0EARDW0)
          Port1 : /dev/sdc ()

通常のスマート情報

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x002f   200   138   051    Pre-fail  Always       -       0
  3 Spin_Up_Time            0x0027   253   143   021    Pre-fail  Always       -       4966
  4 Start_Stop_Count        0x0032   100   100   000    Old_age   Always       -       236
  5 Reallocated_Sector_Ct   0x0033   194   194   140    Pre-fail  Always       -       179
  7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0032   051   051   000    Old_age   Always       -       35906
 10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always       -       0
 11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       213
 16 Unknown_Attribute       0x0022   149   051   000    Old_age   Always       -       2633891565010
192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always       -       130
193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       107
194 Temperature_Celsius     0x0022   119   081   000    Old_age   Always       -       33
196 Reallocated_Event_Count 0x0032   113   113   000    Old_age   Always       -       87
197 Current_Pending_Sector  0x0032   197   196   000    Old_age   Always       -       1765
198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

マザーボードは ASUS X99-E USB 3.1 で、RAID 0 は Intel RST でセットアップされており、I/O コントローラーは BIOS で RAID モードのままです。ただし、現在 BIOS では RAID アレイは WD-WMC5D0D9X6D8 と WD-WMC1F0EARDW0 のみで構成されており、故障したドライブはメンバー ドライブではありません。システムは何らかの方法でドライブ障害を検出し、アレイから自動的に削除する必要があります。

故障したドライブのクローンを作成したいのですが、マシンを再起動し続ける必要がありますか? システム全体ではなく HDD だけを再起動/リセットできるコマンドはありますか? 他に回避策はありますか? ありがとうございます。

関連情報