Existe uma maneira de ativar uma configuração de rede de proteção contra falhas quando a rede cai?

Existe uma maneira de ativar uma configuração de rede de proteção contra falhas quando a rede cai?

Pergunta

Ao alterar as configurações de rede remotamente, existe uma maneira de a rede tentar usar um arquivo de configuração diferente em caso de falha?

Fundo- tldr;

Tenho pesquisado, mas não estou vendo nenhuma referência a fazer algo como passar um arquivo para o ifup, embora dizer isso me deu uma ideia de verificar a página de manual do ifup, mas independentemente. Não posso testar agora.

Nosso servidor foi movido para o datacenter, enquanto estou aqui trabalhando em uma cidade diferente. A rede não é meu forte e, após a instalação, quis unir as duas placas de rede para melhorar o rendimento. Mas, ao fazer isso, perdi a conectividade porque a interface de rede falhou na inicialização.

Eu tentei configurar o vínculo para ter em /etc/sysconfig/network-scripts

bond0: Pegando eth0 e eth1 eth0: Configure para vincular eth1: Configure para vincular e então eth1:1 pensando que posso vincular um ip a isso caso eu seja bloqueado novamente...

Infelizmente isso não funcionou, e a única pessoa qualificada o suficiente para ir ao datacenter fazer o suporte é meu chefe. Não é uma boa situação. (E eu testei duas vezes em um servidor virtual só para ter certeza de que não perderia a conectividade)

Agora, nós o conectamos, mas não há como fazer uma configuração "por precaução", até onde eu sei...

Portanto, hoje precisei fazer a ponte da conexão para a VM dentro do servidor.... Veja só, perdi a conectividade novamente e é a segunda viagem que meu chefe fará este mês ao datacenter. :facepalm:

Deve haver uma maneira, se a interface não for detectada, a rede usará um conjunto completamente diferente de arquivos de configuração, um sistema à prova de falhas, se preferir, para que, após a tentativa fracassada de rede, um cron job seja executado a cada cinco minutos restabeleceriam a conexão de rede com o sistema à prova de falhas se a rede estivesse inoperante.

Eu gostaria de ter acesso a uma caixa Linux agora, mas normalmente verifico a rede executando um comando de reinicialização da rede de serviço. Existe uma maneira de fornecer um comando à prova de falhas que, se a rede não for detectada, ela, por sua vez, tentará uma configuração à prova de falhas diferente, até que esteja ativa.

Responder1

dr: Vá com OOB, veja o gerenciamento de configuração ou você precisará construir sua própria solução.

Não estou familiarizado com nada pré-construído no Linux para fazer esse tipo de coisa - IPMI/ILOM/OOB geralmente é o caminho a percorrer. Você não apenas teria acesso remoto ao console do host, mas também (normalmente) pode verificar o status do hardware, emitir reinicializações remotas se estiver bloqueado, etc.

Se OOB não for uma opção, considere configurar um cron job para verificar vários cenários e determinar se o seu host está em um estado inacessível e executar tarefas para tentar se recuperar.

Há grandes riscos nisso, é claro. Você deve considerar vários cenários diferentes - digamos que você queira verificar para ter certeza de que pode atingir o endereço IP do seu gateway, mas seu gateway desaparece brevemente - você não quer que seu host reconfigure sua interface se não for um problema com sua caixa, mas algo a montante.

Há também a opção de controle de gerenciamento de configuração que você pode configurar para restaurar sua máquina local para um estado esperado/verificar se está em um estado esperado a cada hora, etc. - você teria que configurar esses aplicativos para usar uma cópia local dos arquivos de configuração em vez do que tentar conversar com um servidor remoto, mas é possível. Isso pode ser um pouco excessivo dependendo de quantos sistemas você está gerenciando (e se for mais de 5, sugiro fortemente que você analise o gerenciamento de configuração em geral, pois isso economizará MUITO tempo).

Se você deseja seguir o caminho de ter algum script no monitor de caixa para alterações, eu recomendo fortemente que você configure-o em modo de simulação por algum tempo. Dessa forma, você poderia fazer com que ele registrasse quando achasse necessário reconfigurar a interface de rede, permitindo depurar/testar/verificar a funcionalidade antes de colocá-la em serviço.

Melhor ainda, você poderia ter uma segunda ou terceira interface (já que deseja se conectar) conectada ao seu host e nunca tocar nessa configuração da interface ou fazer com que seu script apenas tente se restaurar para o serviço usando essa interface - dessa forma, se ele fica descontrolado, não está potencialmente bagunçando interfaces que ele considera ruins, mas apenas a terceira interface que você usa apenas para esse propósito.

informação relacionada