Dell PowerVault MD1000 постоянно отключается

Dell PowerVault MD1000 постоянно отключается

У меня Powervault MD1000, который работает уже больше года без проблем, но в течение последних нескольких недель каждые несколько дней корпус отключается, и его и сервер приходится перезапускать, чтобы снова включить. Сервер работает под управлением Debian, но я не могу себе представить, что это как-то связано с проблемой, потому что корпус на самом деле отключается. (Никакие индикаторы на передней панели не горят, но индикаторы питания на блоках питания остаются включенными и зелеными). Это случалось уже несколько раз, но мне ни разу не удавалось зафиксировать это. При просмотре виртуального диска на экране BIOS управления PERC состояние RAID отображается как оптимальное, и все состояния SMART в порядке. Я пытался поменять модули контроллера хранилища, так как я использую только один, но это, похоже, не помогло. Любая помощь будет высоко оценена.

Журнал Dell OMSA пуст, но в системном журнале в момент возникновения ошибки было указано: «16 января 09:08:35 Ядро SAN-1: [ 2362.584045] megaraid_sas 0000:0e:00.0: MR_DCMD_PD_LIST_QUERY не выполнен/не поддерживается встроенным ПО».

решение1

Используете ли вы оба блока питания в вашем MD1000? Также вращаются ли вентиляторы на блоках питания с нормальной скоростью или они вращаются медленнее? Также была ли единственная ошибка, отображаемая в OMSA, ошибкой SAS? Если все вентиляторы вращаются, а блоки питания зеленые, то я бы проверил, чтобы убедиться, что разъемы надежно установлены, и если они доступны, то я бы поменял их и подключил к другому разъему, если они доступны, чтобы посмотреть, возникнет ли проблема снова. Пожалуйста, дайте нам знать, если у вас есть другие вопросы.

Связанный контент