Qual é o melhor método para obter redundância total em um servidor dedicado?

Qual é o melhor método para obter redundância total em um servidor dedicado?

Tenho lido sobre redundância total para atingir quase, senão 100% de tempo de atividade para seus aplicativos de missão crítica (manipulação de dados financeiros) executados em um servidor dedicado, mas ainda não consigo entender como poderia fazer isso.

1) Digamos que eu tenha vários aplicativos da web (com arquivos grandes e frequentes e atualizações de banco de dados) em execução no meu servidor atual. Pelo que li, precisaria de outro servidor dedicado (como servidor de backup) onde pudesse espelhar todos os arquivos e dados do banco de dados, e se meu servidor primário caísse por qualquer motivo, meu servidor de backup carregaria a carga imediatamente. A transferência do servidor primário para o servidor de backup é feita através do DNS. Isso está correto? Existe uma maneira melhor de obter redundância do que esta?

2) Se fizéssemos o que mencionei no item 1, o que aconteceria se o servidor primário ficasse online novamente? Como o servidor primário acompanharia todas as alterações feitas no servidor de backup?

3) Existe um guia definitivo que eu possa ler sobre a melhor maneira de fazer isso? Já pesquisei no Google, mas o que encontro principalmente não funcionaria para nós porque nossos aplicativos da web não podem ficar inativos por pelo menos 5 minutos e não podemos perder 5 minutos de dados.

4) Existe algum serviço que possa fazer isso por nós? Como já temos um servidor dedicado, o serviço teria que funcionar em torno do ambiente de trabalho existente. Mas eu preferiria aprender como fazer isso sozinho.

Eu apreciaria muito se vocês pudessem me indicar a direção certa aqui.

Responder1

Isto depende inteiramente da arquitetura e das opções de disponibilidade dos aplicativos específicos em uso.

Seu banco de dados oferece suporte a uma implantação em cluster? Uma implantação espelhada/replicada? Ambos? Quais são as advertências de cada um? Qual é o processo de failover/recuperação? Os requisitos de alocação de recursos? E para o seu aplicativo da web? Isso pode ser agrupado? Carga balanceada? Ambos? E quanto ao seu ISP? Você tem conexões redundantes com a Internet? De diferentes conduítes entrando em diferentes lados do edifício para que a construção não atrapalhe ambos? Qual é a sua configuração de energia? Você tem alimentações de energia redundantes? UPS redundantes? Um gerador para o Datacenter?

Essas perguntas não devem ser respondidas aqui - o objetivo é mostrar como é a ponta do iceberg para projetar esse tipo de solução. 100% de tempo de atividade é uma meta inatingível, mas se você quiser chegar o mais perto possível, contrate alguém que tenha experiência nisso, pois você não está nem perto de estar pronto com base no conteúdo da sua pergunta.

Responder2

MDMarra está correto, esta não é uma questão que possa ser razoavelmente respondida de forma definitiva aqui (+1).

Você precisa dar uma olhada em sua aplicação em todas as sete camadas do modelo OSI e então adicionar redundância emcadanível. Provavelmente, você precisará da opinião de todos os desenvolvedores e administradores envolvidos.

Quando a administração começar a reclamar do preço, esteja preparado para discutir o custo do tempo de inatividade versus redundância. Uma boa regra é que cada ponto decimal (99,9% -> 99,99% -> etc) equivale a outro zero no final do custo, então provavelmente se resumirá a um projeto e execução bem pesquisados ​​que atenda às necessidades técnicas e preocupações de custos da administração. Não faz muito sentido construir uma solução de um milhão de dólares para proteger um aplicativo de US$ 1.000.

No entanto, se a administração estiver passando um cheque em branco para você, tenho certeza de que muitas pessoas estariam dispostas a consultar =)

informação relacionada