найти, почему mdadm сбросил диск

найти, почему mdadm сбросил диск

За последний месяц или два у меня дважды mdadm ронял диск. В прошлый раз я снова добавил его, и он работал нормально некоторое время, затем я заметил, что он снова работает в деградированном режиме. Мне было интересно, как найти «причину», по которой он ронял диск.

решение1

Вам следует прочитать системные журналы: обычно /var/log/messagesи/или вывод команды journalctl -xe. Если диск недавно вышел из строя, буфер сообщений ядра (просматриваемый с помощью dmesgкоманды) также может содержать сообщения об этом.

Обычно dmesgсообщения также сохраняются в журналах, но подсистема ведения журналов могла быть настроена на игнорирование некоторых сообщений ядра с низким приоритетом, поэтому в dmesgвыходных данных может содержаться больше подробностей.

Скорее всего, вы увидите поток сообщений об ошибках ввода-вывода/тайм-аутах диска и где-то между ними или после них сообщение от подсистемы RAID о том, что она отмечает диск как неисправный. По сути, если подсистема RAID обнаруживает, что диск начинает сообщать о том, что он не выполняет запросы ввода-вывода (чтение или запись) или по какой-либо причине истекает время ожидания, диск будет отмечен как неисправный.

Для получения дополнительных подсказок вы также можете использовать smartctl -aупавший диск, чтобы посмотреть, какие результаты сообщают его внутренние проверки работоспособности.

Связанный контент