
Estou lutando para entender o conceito de domínio de falha/atualização no Azure, qualquer ajuda seria apreciada. Forneci 2 VMs no mesmo conjunto de disponibilidade com 2 domínios de falha e 2 domínios de atualização, respectivamente:
Fault Domain Update Domain
server_iis1 0 0
server_iis2 1 1
Como eu sei, o Fault Domain na realidade é um rack, porém os seguintes pontos me confundem:
Se eu perder totalmente o Fault Domain 0, então server_iis1 desaparecerá? Onde está localizada a segunda instância do server_iis1 que deve estar instalada e funcionando em caso de falha do rack (domínio de falha 0) que me fornecerá SLA de 99,95%?
Da mesma forma, para server_iis2, se eu perder o domínio de falha 1, como server_iis2 deve estar instalado e funcionando?
Server_iis1 e Server_iis2 são duas VMs completamente diferentes, com dados e clientes diferentes para atender.
Responder1
Os domínios de falha são projetados para proteger sua carga de trabalho (aplicativos executados em uma VM) em caso de falhas inesperadas de hardware. No seu exemplo acima, iis1 e iis2 são duas VMs separadas em execução no mesmo datacenter físico (zona de disponibilidade), mas estão em domínios de falha diferentes. O que isso significa é que se por algum motivo algum componente físico da infraestrutura de suporte da VM falhar (fonte de alimentação do rack, switch, host físico, etc.), o outro iis VM permanecerá ativo porque está em um cluster de hardware diferente (domínio de falha) no mesmo datacenter.
Uma coisa que não está tão clara para muitas pessoas é que seu aplicativo deve ser inteligente o suficiente para ser executado nas duas máquinas simultaneamente. Se eu tiver um aplicativo (excel como um exemplo muito básico (apenas me agrade)) no iis1 e um aplicativo diferente (powerpoint) no iis2, se o iis1 falhar, você perderá o acesso ao aplicativo (excel) até que a VM faça failover para outro host, o que pode levar alguns minutos. E vice-versa para o iis2, se caísse você perderia (powerpoint). Para realmente fazer com que os domínios de falha funcionem, você precisaria do Excel e do PowerPoint em execução no iis1 e no iis2; portanto, se uma VM falhar, a outra ainda poderá servir o aplicativo e, é claro, seu aplicativo precisará ser inteligente o suficiente para lidar com a falha/failover.
Muuuito domínios de falha protegem contra falhas inesperadas e imprevistas na infraestrutura.
Os domínios de atualização são projetados para garantir que durante as janelas de manutenção (iniciadas pelo cliente ou pela Microsoft) não reinicializemos/atualizemos todas as máquinas de uma só vez.
Por exemplo, se eu tivesse 5 servidores web front-end conectados a 5 servidores back-end, colocaria os 5 servidores front-end no mesmo domínio de atualização para que eles nunca fossem reinicializados ao mesmo tempo, garantindo que eu sempre possa atender o tráfego da web. Isso também vale para meus servidores back-end. Eu os colocaria em um domínio de atualização para garantir que nunca fossem reinicializados ao mesmo tempo. Isso garante que eu mantenha o(s) servidor(es) funcionando, embora degradados durante as janelas de manutenção.
Os conjuntos de disponibilidade fornecem um SLA de 99,95%. As zonas de disponibilidade fornecem um SLA de 99,99%
A implantação de sua VM em uma zona de disponibilidade replicará sua VM em outro datacenter físico (zona). Esse failover acontece automaticamente sem que o cliente precise fazer nada se algo quebrar.
O conjunto de disponibilidade é mais barato para implantar zonas de disponibilidade e custa mais porque você não apenas tem os custos de VM, mas também os custos associados à replicação de dados entre zonas, mas estamos falando de centavos por dólar.
espero que ajude