Estamos conduzindo testes de resiliência semestrais em um cluster VCS de 4 nós. Com dois aplicativos em execução nos nós 1-3 e 2-4 respectivamente. no modo de espera ativa.
Ao fazer uma troca manual ou um desligamento normal em um nó, o aplicativo mudará perfeitamente para o outro nó.
No entanto, quando desligamos ou reinicializamos um nó, parece que a ausência de uma transferência por parte do nó afetado acionauma reinicialização dos outros nós do cluster. Além do mais, em caso de desligamento, os nós restantes reiniciam, masnão consegue ingressar no cluster. Quando o servidor eliminado for retomado, todos se juntarão novamente.
Isto vai contrariar totalmente o propósito de um cluster, obviamente. Nosso fornecedor que forneceu os aplicativos e o software de cluster (com o hardware) propõe que tal caso não é realista e que os servidores sempre funcionam bem quando ficam inativos.
Não temos especialização em tecnologias proprietárias de cluster, portanto, embora assumamos que sua afirmação está incorreta, não sabemos o que pode estar errado. Suspeito, entretanto, que qualquer software de cluster comercialmente bem-sucedido possa lidar com essas situações, mas nossa implementação sofre erros de configuração.
Qualquer pista seria apreciada.