В журналах появляются такие записи:
2 окт 22:11:21 ядро jupiter: [439646.093111] ata4.00: исключение Emask 0x0 SAct 0x0 SErr 0x0 действие 0x6 2 окт 22:11:21 ядро jupiter: [439646.093144] ata4.00: BMDMA stat 0x6 2 окт 22:11:21 ядро jupiter: [439646.093176] ata4.00: не удалось выполнить команду: WRITE DMA EXT 2 окт 22:11:21 ядро jupiter: [439646.093206] ata4.00: cmd 35/00:98:00:0d:ff/00:02:42:00:00/e0 тег 0 dma 339968 выход 2 окт 22:11:21 ядро jupiter: [439646.093282] ata4.00: статус: { DRDY ERR } 2 окт 22:11:21 ядро jupiter: [439646.093306] ata4.00: ошибка: { ICRC ABRT } 2 окт 22:11:21 ядро jupiter: [439646.093353] ata4: ссылка на программный сброс 2 окт 22:11:21 ядро jupiter: [439646.265242] ata4.00: настроено для UDMA/133 2 окт 22:11:21 ядро jupiter: [439646.265268] ata4: EH завершено
Теперь мне интересно, какой диск заменить. Но я не могу найти четкого соответствия между записями "ataX.YZ" и /dev/disk/.
решение1
Вы должны получить больше информации от dmesg:
dmesg | grep ata
Что-то вроде:
[ 2.345126] ata2.00: ATA-8: WDC WD20EARX-00PASB0, 51.0AB51, max UDMA/133
Это мой жесткий диск Wester Digital.
Вот способ, если у вас несколько дисков одной модели (когда вышеперечисленное не поможет):
Найдите сопоставление хоста SCSI с идентификатором ata*:
$ egrep "^[0-9]{1,}" /sys/class/scsi_host/host*/unique_id /sys/class/scsi_host/host0/unique_id:1 /sys/class/scsi_host/host1/unique_id:2 /sys/class/scsi_host/host2/unique_id:3 /sys/class/scsi_host/host3/unique_id:4
Найдите сопоставление хоста SCSI с идентификатором sd*:
$ ls -l /sys/block/sd* ... /sys/block/sda -> ../devices/pci0000:00/0000:00:1f.2/host0/target0:0:0/0:0:0:0/block/sda ... /sys/block/sdb -> ../devices/pci0000:00/0000:00:1f.2/host1/target1:0:0/1:0:0:0/block/sdb
Теперь вы можете связать эти два результата через идентификатор host*. Так что если в этом случае у меня возникнут проблемы с ata2, я поищу unique_id 2 → host1, а затем, какой sd* является host1 → sdb.
Я также пытался придумать однострочный вариант. Не знаю, насколько он надежный. Сначала нужно установить ata* как переменную:
FAIL=ata1
затем запустите:
echo "$FAIL -> $(ls -l /sys/block/ | grep $(grep "^$(echo $FAIL | cut -c 4-)" /sys/class/scsi_host/host*/unique_id | sed "s/.*\(host[0-9]\{1,\}\).*/\1/") | awk '{print $8}')"
который должен вернуть что-то вроде:
ata1 -> sda
решение2
На некоторых моих серверах у меня есть два или более устройств на одном scsi_host. Я не знаю, правильно ли это, но я предположил, что это можно различить по цели, и это работает для меня:
ls -l /sys/block/sd*
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sda -> ../devices/pci0000:00/0000:00:01.0/0000:01:00.0/host3/target3:0:0/3:0:0:0/block/sda
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdb -> ../devices/pci0000:00/0000:00:1f.2/host6/target6:0:0/6:0:0:0/block/sdb
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdc -> ../devices/pci0000:00/0000:00:1f.2/host7/target7:0:0/7:0:0:0/block/sdc
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdd -> ../devices/pci0000:00/0000:00:1f.2/host8/target8:0:0/8:0:0:0/block/sdd
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sde -> ../devices/pci0000:00/0000:00:1f.2/host9/target9:0:0/9:0:0:0/block/sde
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdf -> ../devices/pci0000:00/0000:00:1f.2/host10/target10:0:0/10:0:0:0/block/sdf
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdg -> ../devices/pci0000:00/0000:00:1f.2/host11/target11:0:0/11:0:0:0/block/sdg
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdh -> ../devices/pci0000:00/0000:00:1c.4/0000:04:00.0/host13/target13:0:0/13:0:0:0/block/sdh
lrwxrwxrwx 1 root root 0 2012-02-08 08:15 /sys/block/sdi -> ../devices/pci0000:00/0000:00:1c.4/0000:04:00.0/host13/target13:0:1/13:0:1:0/block/sdi
Простой bash-скрипт:
#!/bin/bash
#inspired by http://askubuntu.com/questions/64351/how-to-match-ata4-00-to-the-apropriate-dev-sdx-or-actual-physical-disk
for d in /sys/block/sd*
do
s=`basename $d`
h=`ls -l $d | egrep -o "host[0-9]+"`
t=`ls -l $d | egrep -o "target[0-9:]*"`
a2=`echo $t | egrep -o "[0-9]:[0-9]$" | sed 's/://'`
a=`cat /sys/class/scsi_host/$h/unique_id`
echo "$s -> ata$a.$a2"
done
и его вывод:
sda -> ata4.00
sdb -> ata7.00
sdc -> ata8.00
sdd -> ata9.00
sde -> ata10.00
sdf -> ata11.00
sdg -> ata12.00
sdh -> ata14.00
sdi -> ata14.01
решение3
Сейчас уже слишком поздно, но ради других читателей... Мне пришлось ответить на ваш другой вопрос: «Теперь я думаю, какой диск заменить».
Флаг ошибки ICRC почти всегда связан с плохим кабелем SATA, его легко заменить/проверить. Немного возможно поднять флаг ICRC, если питание привода неисправно.
Однако несомненно то, что существуетНЕТдоказательство того, что с диском что-то не так! Замените его кабель SATA.