
Um Windows Server 2008 R2 (SBS 2011, na verdade) com Service Pack 1 começou a expor de repente um problema de conectividade de rede que parece bastante difícil de depurar:
Ocasionalmente (sempre durante o horário comercial, aproximadamente 1 a 2 vezes por dia) a conectividade da rede é perdida. O próprio host continua funcionando, posso usar o console de forma interativa. O link Ethernet indicado pelos LEDs no gerenciamento do switch e a NIC continua ativo. A configuração IP ainda está anexada à interface e parece válida ( ipconfig
produz uma saída sensata). No entanto, nem mesmo as pesquisas ARP conseguem ser concluídas com êxito.
Uma lista de coisas que não ajudaram em nada:
- redefinindo a porta do switch ou o switch
- desabilitar/reativar a interface do servidor (no ncpa.cpl ou no gerenciador de dispositivos)
- desconectando / reconectando o cabo de rede
Desligar e reiniciar o servidor sempre ajuda - ele pode ser usado como sempre após a inicialização.
Coisas verificadas:
- os logs de eventos não listam nenhum evento suspeito
- os contadores de porta de rede do switch não mostram erros
- a conexão de rede não mostra nenhum sinal de estranheza (perdas, latências, mau desempenho) enquanto os dados estiverem fluindo
- o cabo e a NIC foram substituídos para descartar uma falha óbvia de hardware
- o gerenciamento de energia da NIC foi desabilitado nas propriedades do dispositivo (gerenciador de dispositivos)
- a NIC usada é uma Intel PRO/1000 CT com processador de rede Intel 82574L (o mesmo tipo é usado nas portas NIC on-board)
- o pacote antiviral da AVG (Edição empresarial antivírus) está instalado no servidor, mas o componente Firewall foi removido durante a instalação, portanto não deve interferir aqui
Como uma falha de hardware parece improvável, estou tentando determinar qual componente de software pode ser responsável por bagunçar tanto a pilha de rede. Existe alguma maneira sensata de descobrir quais drivers estão na pilha de rede e, portanto, possivelmente interferindo? Alguém já viu algo semelhante antes? Quaisquer ideias que possam levar à resolução são bem-vindas.
Responder1
Eu faria duas coisas para tentar resolver o problema:
Primeiro, remova o AV. Completamente. Não desabilite apenas uma parte ou outra, desinstale-a. Em segundo lugar, supondo que ainda falhe de vez em quando, troque a NIC e os cabos.
Responder2
Desapareceu tão repentinamente quanto surgiu. O switch foi substituído entretanto, mas o sistema mostrou estar funcionando por alguns dias sem problemas antes.
Editar: embora eu não tenha nenhuma prova decente disso, parece que o software responsável foi oProxy Wingateinstalado no mesmo servidor. Os relatórios dos usuários indicam que problemas foram observados após a atualização do produto e desapareceram após a desinstalação. Um cenário semelhante envolvendo drivers de filtro TDI foi documentadoaqui, embora a resolução cubra apenas o Windows Server 2008. E o WinGate parece estar realmente empregando TDI.