Temos um ambiente de Active Directory com 2 servidores - WS2019 sendo o "principal" contendo todos os FSMO e WS2022 sendo "reserva", quase todos os clientes são Windows 10. Ambos estão na mesma sub-rede dos clientes, mas localizados em prédios diferentes (ainda em mesmo L2, sem túneis ou smth). Os endereços de ambos os DNS são distribuídos através do MikroTik DHCP - WS2019 192.168.240.100 como primário, WS2022 192.168.240.102 como secundário, ambos mostrados corretamente no status do adaptador em cada cliente. DPS internos são configurados para redirecionar consultas externas para 8.8.8.8. Podemos executar ping em ambos os servidores DNS em todas as máquinas.
Recentemente tivemos uma manutenção de rede, durante a qual nosso WS2022 foi desconectado do restante da rede (que ainda estava funcional). Esperávamos que nada de especial acontecesse, pois ainda temos nosso WS2019 totalmente funcional e conectado ao segmento de rede funcional. No entanto, este não foi o caso. Emitimos problemas de resolução de nomes em todos os nossos clientes Windows. Ambos os servidores replicaram bem, dcdiag /q não mostra erros, nem erros nos logs.
O engraçado é que se removermos o WS2022 da lista DHCP DNS e deixarmos apenas o WS2019, ele funcionará perfeitamente e resolverá tudo bem. Também é estranho para mim que isso esteja definido como DNS primário e não seja usado.
A questão é: o que podemos verificar/fazer para que nossos clientes façam um failover correto entre os dois servidores DNS?