За последний месяц или два у меня дважды mdadm ронял диск. В прошлый раз я снова добавил его, и он работал нормально некоторое время, затем я заметил, что он снова работает в деградированном режиме. Мне было интересно, как найти «причину», по которой он ронял диск.
решение1
Вам следует прочитать системные журналы: обычно /var/log/messages
и/или вывод команды journalctl -xe
. Если диск недавно вышел из строя, буфер сообщений ядра (просматриваемый с помощью dmesg
команды) также может содержать сообщения об этом.
Обычно dmesg
сообщения также сохраняются в журналах, но подсистема ведения журналов могла быть настроена на игнорирование некоторых сообщений ядра с низким приоритетом, поэтому в dmesg
выходных данных может содержаться больше подробностей.
Скорее всего, вы увидите поток сообщений об ошибках ввода-вывода/тайм-аутах диска и где-то между ними или после них сообщение от подсистемы RAID о том, что она отмечает диск как неисправный. По сути, если подсистема RAID обнаруживает, что диск начинает сообщать о том, что он не выполняет запросы ввода-вывода (чтение или запись) или по какой-либо причине истекает время ожидания, диск будет отмечен как неисправный.
Для получения дополнительных подсказок вы также можете использовать smartctl -a
упавший диск, чтобы посмотреть, какие результаты сообщают его внутренние проверки работоспособности.