mdadm - программный рейд

mdadm - программный рейд

Я настроил небольшой серверный компьютер Ubuntu 11.04 на основе RAID и только что получил от него это письмо. Как я могу это проверить?

Ричард

Это автоматически сгенерированное почтовое сообщение от mdadm, работающего на godzilla.

На md-устройстве /dev/md/0 обнаружено событие сбоя.

Это может быть связано с компонентом устройства /dev/sda1.

С уважением и т.д.

P.S. Файл /proc/mdstat в настоящее время содержит следующее:

Личности: [линейный] [многопутевой] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: активный raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 блока super 1.2 уровень 5, кусок 512k, алгоритм 2 [4/3] [_UUU] [>..................] проверка = 2.2% (21655188/975711744) финиш=4419.8мин скорость=3597K/сек

&> кот /proc/mdstatЛичности: [линейный] [многопутевой] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: активный raid5 sda10 sdb1[1] sdd1[3] sdc1[2] 2927135232 блока super 1.2 уровень 5, кусок 512k, алгоритм 2 [4/3] [_UUU]

неиспользуемые устройства:

кот /proc/mdstatЛичности: [линейный] [многопутевой] [raid0] [raid1] [raid6] [raid5] [raid4] [raid10] md0: активный raid5sda1[0]Фsdb1[1]sdd1[3] sdc1[2] 2927135232 блока super 1.2 уровень 5, фрагмент 512k, алгоритм 2 [4/3] [_UUU]

неиспользуемые устройства:

Dmsg [775549.274966] md/raid:md0: Сбой диска на sda1, отключение устройства. [775549.274967] md/raid:md0: Операция продолжается на 3 устройствах. [775549.280021] md/raid:md0: ошибка чтения не может быть исправлена ​​(сектор 43310408 на sda1
). [775549.280028] md/raid:md0: ошибка чтения не может быть исправлена ​​(сектор 43310416 на sda1
). [775549.280031] md/raid:md0: ошибка чтения не может быть исправлена ​​(сектор 43310424 на sda1
). [775549.280035] md/raid:md0: ошибка чтения не может быть исправлена ​​(сектор 43310432 на sda1
). [775549.280039] md/raid:md0: ошибка чтения не может быть исправлена ​​(сектор 43310440 на sda1
). [775549.280043] md/raid:md0: ошибка чтения не может быть исправлена ​​(сектор 43310448 на sda1
). [775549.280047] md/raid:md0: ошибка чтения не может быть исправлена ​​(сектор 43310456 на sda1
). [775549.280051] md/raid:md0: ошибка чтения не может быть исправлена ​​(сектор 43310464 на sda1
). [775549.280055] md/raid:md0: ошибка чтения, не подлежащая исправлению (сектор 43310472 на sda1
). [775549.280226] ata7: EH завершен [775549.316567] ata7.00: исключение Emask 0x0 SAct 0x0 SErr 0x300000 действие 0x6 [775549.319133] ata7.00: BMDMA stat 0x45 [775549.321658] ata7: SError: { Dispar BadCRC } [775549.324237] ata7.00: не удалось выполнить команду: READ DMA EXT [775549.326754] ata7.00: cmd 25/00:f8:28:ed:94/00:03:02:00:00/e0 тег 0 dma 52019
2 в [775549.326757] res 51/84:48:78:7f:2e/84:00:03:00:00/e0 Emask 0x10 (
ошибка шины ATA) [775549.331806] ata7.00: статус: { DRDY ERR } [775549.334350] ata7.00: ошибка: { ICRC ABRT } [775549.336890] ata7: жесткий сброс связи [775549.336895] ata7: nv: пропуск жесткого сброса на занятом порту [775549.340260] md: md0: проверка данных выполнена. [775549.804062] ata7: SATA соединение установлено 3,0 Гбит/с (SStatus 123 SControl 300) [775549.844352] ata7.00: настроено для UDMA/33 [775549.844390] ata7: EH завершено [775549.936450] Распечатка конфигурации RAID: [775549.936456] --- уровень:5 рд:4 wd:3 [775549.936460] диск 0, o:0, устройство:sda1 [775549.936463] диск 1, o:1, устройство:sdb1 [775549.936465] диск 2, o:1, устройство:sdc1 [775549.936507] диск 3, o:1, устройство:sdd1 [775549.936557] Распечатка конфигурации RAID: [775549.936559] --- уровень:5 рд:4 wd:3 [775549.936562] диск 1, o:1, устройство:sdb1 [775549.936564] диск 2, o:1, устройство:sdc1 [775549.936567] диск 3, o:1, устройство:sdd1

sudo mdadm --detail /dev/md0

/dev/md0: Версия: 1.2 Время создания: Сб Янв 1 14:43:44 2005 Уровень рейда: raid5 Размер массива: 2927135232 (2791,53 ГиБ 2997,39 ГБ) Использованный размер Dev: 975711744 (930,51 ГиБ 999,13 ГБ) Устройства рейда: 4 Всего устройств: 4 Постоянство: Суперблок постоянный

Update Time : Sun Feb  5 19:17:41 2012
      State : clean, degraded  Active Devices : 3 Working Devices : 3  Failed Devices : 1   Spare Devices : 0

     Layout : left-symmetric
 Chunk Size : 512K

       Name : godzilla:0  (local to host godzilla)
       UUID : 7c2be5e4:25e338e5:b575b8cd:83896caf
     Events : 657

Number   Major   Minor   RaidDevice State
   0       0        0        0      removed
   1       8       17        1      active sync   /dev/sdb1
   2       8       33        2      active sync   /dev/sdc1
   3       8       49        3      active sync   /dev/sdd1

   0       8        1        -      faulty spare   /dev/sda1

решение1

Я бы посмотрел на вывод 'dmesg', а также на файл /var/log/syslog. Там могут быть намеки на проблемы с /dev/sda1.

Жесткий диск мог выйти из строя, но это также может быть просто кабель, который плохо подключен (SATA-кабели просто... не такие уж и крутые). Посмотрите, подключено ли устройство, может быть, оно доступно под другим именем, например /dev/sde1 или каким-то другим свободным именем в вашей системе. Как уже упоминалось, я бы также проверил dmesg/syslog, SMART. Возможно, кабель просто нужно правильно подключить или заменить. В большинстве случаев вы можете повторно добавить диск в свой RAID-массив — я бы использовал эти команды только в том случае, если проблема действительно связана с поврежденными кабелями или чем-то подобным, т. е. нет «реального» отказа жесткого диска.

mdadm --fail /dev/mdX /dev/sdX # set the disk faulty
mdadm -r /dev/mdX /dev/sdX # remove faulty disk
mdadm --re-add /dev/mdX /dev/sdX # re-add disk

Отказ от ответственности: никаких гарантий, у вас должны быть резервные копии, это восстановит ваш RAID-массив — на тот момент резервирования не будет и т. д.

Связанный контент