Failover de cluster do SQL Server deixa bancos de dados “suspeitos”

Failover de cluster do SQL Server deixa bancos de dados “suspeitos”

Estou no meio da manutenção do servidor, atualizei o BIOS de 1 nó e as atualizações do Windows e agora estou tentando fazer failover de nosso cluster de banco de dados para o nó passivo e atualizado. Ele falha bem, mas dois dos 8 bancos de dados acabam sendo "suspeitos".

Isso pode ser por causa das atualizações do Windows ou da BIOS?

Editar: estou usando o comando cluster move group do administrador do cluster.

Quando o movo de volta, o suspeito vai embora e tudo funciona bem. O problema está apenas em um nó.

Responder1

Parece que você tem um banco de dados conectado a uma unidade que não está configurada no cluster ou que as dependências não estão configuradas corretamente. Isso fará com que o SQL Server seja iniciado antes que os discos estejam prontos, o que fará com que o banco de dados fique suspeito.

Verifique o ERRORLOG e veja qual é o motivo do banco de dados se tornar suspeito.

Responder2

Tudo é possível, mas eu estaria mais inclinado a verificar primeiro se há problemas no disco rígido (ou RAID).

Pergunte a si mesmo o seguinte:

  1. O que mais mudou recentemente (que poderia ser uma causa mais provável) no seu ambiente?

  2. Dê uma olhada nos logs do SQL Server para ver se você consegue determinar QUANDO o erro ocorreu. Isso corresponde à atualização do BIOS e à teoria do Windows Update?

  3. Converse com os membros da sua equipe para perguntar quais mudanças foram feitas e quando.

  4. Veja se o problema ocorreu em algum outro servidor do seu ambiente.

Responder3

Como você está falhando? Espero que você esteja utilizando o comando CLUSTER GROUP /MOVE, ou pelo menos através do MMC - MOVE GROUP.

Detesto ver o termo "failover" quando falo sobre clusters.

Responder4

Eu suspeito (trocadilho intencional) bancos de dados que estão com problemas têm unidades de armazenamento compartilhadas que não são vistas corretamente pelo Windows no nível do sistema operacional.

Verifique se, ao fazer failover, você pode navegar até as unidades compartilhadas e encontrar os arquivos mdf e ldf para esses bancos de dados; caso contrário, você deve remover o nó do cluster e reinicializar as unidades compartilhadas no servidor.

informação relacionada