Я получаю следующую ошибку:
[root@mediaserv ~]# mount /dev/mapper/media1 /media
mount: /media: can't read superblock on /dev/mapper/media1.
Это Fedora 33. У меня RAID5 из 8x 8TB дисков WD Red, работающих на RAID-контроллере Adaptec 7805Q, это /dev/sdc. У меня на нем один раздел GPT, /dev/sdc1, который зашифрован с помощью LUKSv2 с файловой системой XFS.
[root@mediaserv ~]# lsblk /dev/sdc
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sdc 8:32 1 50.9T 0 disk
└─sdc1 8:33 1 50.9T 0 part
└─media1 253:0 0 50.9T 0 crypt
[root@mediaserv ~]#
RAID оказался в деградированном режиме. По всей вероятности, я задел кабель на первом диске при установке нового вентилятора. В любом случае, после загрузки он работал в деградированном режиме несколько часов, прежде чем я это обнаружил. Я выключил его, загрузил в однопользовательский режим из образа восстановления, затем дал ему поработать, чтобы перестроить массив. Это заняло около 14 часов.
Загружаю его обратно, мне предлагают ввести пароль LUKs раздела, но он просто стоит там. Я оставил это работать около 8 часов, не уверен, исправлялось ли что-то в фоновом режиме.
Я снова загрузился из rescue. Закомментировал файловую систему из /etc/crypttab
и /etc/fstab
и теперь могу войти в систему без /media
смонтированной файловой системы.
Мне удалось cryptsetup luksOpen /dev/sdc1 media1
успешно выполнить операцию; раздел, похоже, расшифровался без ошибок.
Когда я запускаю команду монтирования (выше), я получаю следующее /var/log/messages
:
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#340 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=0s
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#340 Sense Key : Hardware Error [current]
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#340 Add. Sense: Internal target failure
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#340 CDB: Read(16) 88 00 00 00 00 00 00 00 11 00 00 00 00 01 00 00
Jan 5 10:23:00 mediaserv kernel: blk_update_request: critical target error, dev sdc, sector 34816 op 0x0:(READ) flags 0x80700 phys_seg 1 prio class 0
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#341 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=0s
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#341 Sense Key : Hardware Error [current]
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#341 Add. Sense: Internal target failure
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#341 CDB: Read(16) 88 00 00 00 00 00 00 00 11 00 00 00 00 01 00 00
Jan 5 10:23:00 mediaserv kernel: blk_update_request: critical target error, dev sdc, sector 34816 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
Jan 5 10:23:00 mediaserv kernel: Buffer I/O error on dev dm-0, logical block 0, async page read
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#342 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=0s
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#342 Sense Key : Hardware Error [current]
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#342 Add. Sense: Internal target failure
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#342 CDB: Read(16) 88 00 00 00 00 00 00 00 11 00 00 00 00 01 00 00
Jan 5 10:23:00 mediaserv kernel: blk_update_request: critical target error, dev sdc, sector 34816 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
Jan 5 10:23:00 mediaserv kernel: EXT4-fs (dm-0): unable to read superblock
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#343 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=0s
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#343 Sense Key : Hardware Error [current]
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#343 Add. Sense: Internal target failure
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#343 CDB: Read(16) 88 00 00 00 00 00 00 00 11 00 00 00 00 01 00 00
Jan 5 10:23:00 mediaserv kernel: blk_update_request: critical target error, dev sdc, sector 34816 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
Jan 5 10:23:00 mediaserv kernel: EXT4-fs (dm-0): unable to read superblock
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#344 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=0s
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#344 Sense Key : Hardware Error [current]
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#344 Add. Sense: Internal target failure
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#344 CDB: Read(16) 88 00 00 00 00 00 00 00 11 00 00 00 00 01 00 00
Jan 5 10:23:00 mediaserv kernel: blk_update_request: critical target error, dev sdc, sector 34816 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
Jan 5 10:23:00 mediaserv kernel: EXT4-fs (dm-0): unable to read superblock
Jan 5 10:23:00 mediaserv kernel: ISOFS: unsupported/invalid hardware sector size 4096
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#345 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=0s
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#345 Sense Key : Hardware Error [current]
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#345 Add. Sense: Internal target failure
Jan 5 10:23:00 mediaserv kernel: sd 12:0:0:0: [sdc] tag#345 CDB: Read(16) 88 00 00 00 00 00 00 00 11 00 00 00 00 01 00 00
Jan 5 10:23:00 mediaserv kernel: blk_update_request: critical target error, dev sdc, sector 34816 op 0x0:(READ) flags 0x0 phys_seg 1 prio class 0
Jan 5 10:23:00 mediaserv kernel: FAT-fs (dm-0): unable to read boot sector
Я пытался запустить xfs_repair
, но пока не пробовал эту -L
опцию.
[root@mediaserv ~]# xfs_repair /dev/mapper/media1
Phase 1 - find and verify superblock...
superblock read failed, offset 0, size 524288, ag 0, rval -1
fatal error -- Remote I/O error
Я не уверен, куда мне идти дальше, я беспокоюсь, что могу выполнить неправильную команду и нанести еще больший ущерб. Любая помощь, безусловно, будет оценена по достоинству.
Спасибо!
-Майк
РЕДАКТИРОВАТЬ:
После некоторых дополнительных исследований я не думаю, что это проблема суперблока, я думаю, что эта ошибка была из-за того, что я не указал тип файловой системы в команде монтирования. Повторно запустив ее более правильно, я получаю:
[root@mediaserv ~]# mount -t xfs /dev/mapper/media1 /media
mount: /media: mount(2) system call failed: Remote I/O error.
Что добавляет следующее в мой /var/log/messages
:
Jan 5 12:15:43 mediaserv kernel: sd 12:0:0:0: [sdc] tag#838 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=0s
Jan 5 12:15:43 mediaserv kernel: sd 12:0:0:0: [sdc] tag#838 Sense Key : Hardware Error [current]
Jan 5 12:15:43 mediaserv kernel: sd 12:0:0:0: [sdc] tag#838 Add. Sense: Internal target failure
Jan 5 12:15:43 mediaserv kernel: sd 12:0:0:0: [sdc] tag#838 CDB: Read(16) 88 00 00 00 00 00 00 00 11 00 00 00 00 01 00 00
Jan 5 12:15:43 mediaserv kernel: blk_update_request: critical target error, dev sdc, sector 34816 op 0x0:(READ) flags 0x1000 phys_seg 1 prio class 0
Jan 5 12:15:43 mediaserv kernel: XFS (dm-0): SB validate failed with error -121.
Я не уверен, как это интерпретировать. Неверные данные, начиная с сектора 34816?
ПРАВКА №2:
Что касается работоспособности RAID-массива. Как я уже упоминал, он перешел в деградированный режим с потерей диска. Я вывел его из эксплуатации и перевел в однопользовательский режим, пока RAID восстанавливался. Ниже приведен вывод инструмента Adaptec после восстановления (я сократил его, чтобы сделать менее подробным):
arcconf getconfig 1
----------------------------------------------------------------------
Controller information
----------------------------------------------------------------------
Controller Status : Optimal
Controller Mode : RAID (Expose RAW)
Controller Model : Adaptec ASR7805Q
Performance Mode : Big Block Bypass
--------------------------------------------------------
RAID Properties
--------------------------------------------------------
Logical devices/Failed/Degraded : 1/0/0
Copyback : Disabled
Automatic Failover : Enabled
Background consistency check : Disabled
Background consistency check period : 0
----------------------------------------------------------------------
Logical device information
----------------------------------------------------------------------
Logical Device number 0
Logical Device name : media
Block Size of member drives : 4K Bytes
RAID level : 5
Status of Logical Device : Optimal
Size : 53387257 MB
Parity space : 7626751 MB
Stripe-unit size : 1024 KB
Interface Type : Serial ATA
Device Type : HDD
Read-cache setting : Enabled
Read-cache status : On
Write-cache setting : On when protected by battery/ZMM
Write-cache status : On
maxCache read cache setting : Enabled
maxCache read cache status : Off
maxCache write cache setting : Disabled
maxCache write cache status : Off
Partitioned : Yes
Protected by Hot-Spare : No
Bootable : Yes
Failed stripes : Yes
Power settings : Disabled
----------------------------------------------------------------------
Physical Device information
----------------------------------------------------------------------
Device #0
Device is a Hard drive
State : Online
Block Size : 4K Bytes
Device #1
Device is a Hard drive
State : Online
Block Size : 4K Bytes
Device #2
Device is a Hard drive
State : Online
Block Size : 4K Bytes
Device #3
Device is a Hard drive
State : Online
Block Size : 4K Bytes
Device #4
Device is a Hard drive
State : Online
Block Size : 4K Bytes
Device #5
Device is a Hard drive
State : Online
Block Size : 4K Bytes
Device #6
Device is a Hard drive
State : Online
Block Size : 4K Bytes
Device #7
Device is a Hard drive
State : Online
Block Size : 4K Bytes
Это SMART-статус каждого из дисков в массиве:
[root@mediaserv ~]# smartctl -a -d "aacraid,0,0,0" /dev/sdc | grep health
SMART overall-health self-assessment test result: PASSED
[root@mediaserv ~]# smartctl -a -d "aacraid,0,0,1" /dev/sdc | grep health
SMART overall-health self-assessment test result: PASSED
[root@mediaserv ~]# smartctl -a -d "aacraid,0,0,2" /dev/sdc | grep health
SMART overall-health self-assessment test result: PASSED
[root@mediaserv ~]# smartctl -a -d "aacraid,0,0,3" /dev/sdc | grep health
SMART overall-health self-assessment test result: PASSED
[root@mediaserv ~]# smartctl -a -d "aacraid,0,0,4" /dev/sdc | grep health
SMART overall-health self-assessment test result: PASSED
[root@mediaserv ~]# smartctl -a -d "aacraid,0,0,5" /dev/sdc | grep health
SMART overall-health self-assessment test result: PASSED
[root@mediaserv ~]# smartctl -a -d "aacraid,0,0,6" /dev/sdc | grep health
SMART overall-health self-assessment test result: PASSED
[root@mediaserv ~]# smartctl -a -d "aacraid,0,0,7" /dev/sdc | grep health
SMART overall-health self-assessment test result: PASSED
ОДНАКО, не далее как пару часов назад, просматривая логи, я обнаружил следующее:
Jan 4 08:25:25 mediaserv kernel: sd 12:0:0:0: [sdc] tag#0 FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE cmd_age=9s
Jan 4 08:25:25 mediaserv kernel: sd 12:0:0:0: [sdc] tag#0 Sense Key : Hardware Error [current]
Jan 4 08:25:25 mediaserv kernel: sd 12:0:0:0: [sdc] tag#0 Add. Sense: Internal target failure
Jan 4 08:25:25 mediaserv kernel: sd 12:0:0:0: [sdc] tag#0 CDB: Read(16) 88 00 00 00 00 01 60 2f 5c bf 00 00 00 20 00 00
Jan 4 08:25:25 mediaserv kernel: blk_update_request: critical target error, dev sdc, sector 47269471736 op 0x0:(READ) flags 0x80700 phys_seg 5 prio class 0
Пять из вышеперечисленных событий в указанной последовательности, которые все еще продолжают регистрироваться в журналах, и следующее событие произошло в то же время, когда на машине была потеряна файловая система:
Jan 4 08:26:32 mediaserv kernel: aacraid: Host adapter abort request.#012aacraid: Outstanding commands on (12,0,0,0):
Jan 4 08:26:32 mediaserv kernel: aacraid: Host adapter abort request.#012aacraid: Outstanding commands on (12,0,0,0):
Jan 4 08:26:32 mediaserv kernel: aacraid: Host adapter abort request.#012aacraid: Outstanding commands on (12,0,0,0):
Jan 4 08:26:55 mediaserv kernel: aacraid: Host adapter abort request.#012aacraid: Outstanding commands on (12,0,0,0):
Jan 4 08:26:55 mediaserv kernel: aacraid: Host bus reset request. SCSI hang ?
Jan 4 08:26:55 mediaserv kernel: aacraid 0000:02:00.0: outstanding cmd: midlevel-0
Jan 4 08:26:55 mediaserv kernel: aacraid 0000:02:00.0: outstanding cmd: lowlevel-0
Jan 4 08:26:55 mediaserv kernel: aacraid 0000:02:00.0: outstanding cmd: error handler-0
Jan 4 08:26:55 mediaserv kernel: aacraid 0000:02:00.0: outstanding cmd: firmware-56
Jan 4 08:26:55 mediaserv kernel: aacraid 0000:02:00.0: outstanding cmd: kernel-0
Jan 4 08:26:55 mediaserv kernel: aacraid 0000:02:00.0: Controller reset type is 3
Jan 4 08:26:55 mediaserv kernel: aacraid 0000:02:00.0: Issuing IOP reset
Jan 4 08:27:30 mediaserv kernel: aacraid 0000:02:00.0: IOP reset succeeded
Jan 4 08:27:30 mediaserv kernel: aacraid: Comm Interface type2 enabled
Jan 4 08:27:56 mediaserv kernel: aacraid 0000:02:00.0: Scheduling bus rescan
Интересно отметить, что массив перешел в деградированный режим, а затем, спустя 10 часов и 15 минут, произошло то, что описано выше. Таким образом, проблема с массивом и проблема с файловой системой xfs произошли с разницей в несколько часов. И хотя массив и диски сейчас сообщают о своем здоровье, явсе ещеполучение блока «Результат НЕУДАЧНЫЙ» выше.