Отказоустойчивость кластера SQL Server оставляет базы данных «под подозрением»

Отказоустойчивость кластера SQL Server оставляет базы данных «под подозрением»

Я нахожусь в середине обслуживания сервера, я обновил BIOS и обновления Windows на 1 узле, и теперь я пытаюсь переключить наш кластер базы данных на пассивный, обновленный узел. Он нормально переключается, но две из 8 баз данных оказываются «подозрительными».

Может ли это быть из-за обновлений Windows или BIOS?

Редактировать: Я использую команду перемещения группы кластера от администратора кластера.

Когда я возвращаю его обратно, подозрительный объект исчезает, и все работает нормально. Проблема только на одном узле.

решение1

Похоже, у вас есть база данных, подключенная к диску, который не настроен на кластере, или зависимости настроены неправильно. Это приведет к запуску SQL Server до того, как диски будут готовы, что приведет к тому, что база данных станет подозрительной.

Проверьте ERRORLOG и выясните, по какой причине база данных стала подозрительной.

решение2

Все возможно, но я бы предпочел сначала проверить жесткий диск (или RAID) на наличие проблем.

Задайте себе следующие вопросы:

  1. Что еще недавно изменилось (что может быть более вероятной причиной) в вашей среде?

  2. Посмотрите на журналы SQL Server, чтобы узнать, КОГДА произошла ошибка. Соответствует ли это вашей теории обновления BIOS и Windows Update?

  3. Поговорите с членами вашей команды и спросите их, какие изменения были внесены и когда.

  4. Проверьте, возникла ли эта проблема на других серверах в вашей среде.

решение3

Как вы отрабатываете отказ? Надеюсь, вы используете команду CLUSTER GROUP /MOVE или хотя бы через MMC - MOVE GROUP.

Ненавижу термин «отказоустойчивость», когда речь идет о кластерах.

решение4

Я подозреваю (каламбур задуман) базы данных, в которых возникают проблемы, имеют общие диски хранения, которые некорректно отображаются в Windows на уровне ОС.

Проверьте, что при аварийном переключении вы можете перейти к общим дискам и найти файлы mdf и ldf для этих баз данных. Если нет, то вам следует удалить узел из кластера и повторно инициализировать общие диски на сервере.

Связанный контент