Nósrecentemente tive um pequeno problemacom redes onde vários servidores perderiam intermitentemente a conectividade de rede de uma forma bastante difícil de resolver (reinicialização forçada necessária). Isso vem acontecendo há cerca de duas semanas, aparentemente de forma aleatória, em servidores diferentes. Nenhum padrão específico que pudéssemos discernir.
Depois de pesquisar um pouco, vimos que o switch estava reportando 100 Mbps para a porta com problema:
Isso se parece muito com o que aconteceu no artigo de Joel SpolskyCinco porquês
Michael passou algum tempo fazendo uma análise post-mortem e descobriu que o problema era um simples problema de configuração no switch. Existem várias velocidades possíveis que um switch pode usar para se comunicar (10, 100 ou 1.000 megabits/segundo). Você pode definir a velocidade manualmente ou deixar o switch negociar automaticamente a velocidade mais alta com a qual ambos os lados podem trabalhar.O switch que falhou foi configurado para negociação automática. Isso geralmente funciona, mas nem sempre, e na manhã de 10 de janeiro não funcionou.
Nós temos agoranegociação automática desativadaem nosso hardware de rede e configure-o para uma taxa fixa de 1000 Mbps (gigabit).
Minhas perguntas para aqueles com mais experiência em redes de hardware de servidor:
- Quão comuns são os problemas de negociação automática com hardware de rede moderno?
- É considerada uma boa prática de rede padrão desabilitar a negociação automática e definir velocidades fixas ao configurar a rede?
Responder1
Ainda estou para ver um problema com a negociação automática de velocidades de rede que não seja causado por (a) uma incompatibilidade entre manual em uma extremidade do link e automático na outra ou (b) falha em um componente do link ( cabo, porta, etc.).
Isso depende do administrador, mas minha experiência me mostrou que, se você especificar manualmente as velocidades do link e as configurações duplex, provavelmente encontrará incompatibilidades de velocidade. Por que? Porque é quase impossível documentar as diversas conexões entre switches e servidores e depois seguir essa documentação ao fazer alterações. A maioria das falhas que vi são causadas por 1 (a) e você só entra nessa situação quando começa a definir manualmente as configurações de velocidade/duplex.
Como mencionado noDocumentação Cisco:
Se você desabilitar a negociação automática, ela ocultará quedas de link e outros problemas da camada física. Desative a negociação automática apenas para dispositivos finais, como NICs Gigabit mais antigas que não suportam a negociação automática Gigabit. Não desative a negociação automática entre switches, a menos que seja absolutamente necessário, pois os problemas da camada física podem passar despercebidos e resultar em loops de spanning tree.
A menos que você esteja preparado para configurar um sistema de gerenciamento de alterações para alterações de rede que exija a verificação de velocidade/duplex (e não se esqueça do controle de fluxo) ou esteja disposto a lidar com incompatibilidades ocasionais resultantes da especificação manual dessas configurações em todos os dispositivos de rede, em seguida, mantenha a configuração padrão de auto/auto.
No futuro, considere monitorar os erros nas portas do switch comMRTGpara que você possa identificar esses problemas antes de ter um problema.
Editar:Vejo muitas pessoas fazendo referência a falhas de negociação em equipamentos antigos. Sim, este era um problema há muito tempo, quando os padrões estavam sendo criados e nem todos os dispositivos os seguiam. Suas NICs e switches têm menos de 10 anos? Se sim, então isso não será um problema.
Responder2
Muito comum, tive vários problemas ao longo dos anos com vários tipos de hardware.
Na minha opinião, se a configuração for estática (ou seja, um rack de servidor) e você não acha que haverá alterações, é uma boa ideia configurar as velocidades e duplexes manualmente. Desde que bem documentado para que problemas futuros possam ser evitados.
EDITAR:
Só para esclarecer, não estou defendendo o uso de velocidades manuais em toda a rede; diria que 95% das vezes automático/automático é a melhor opção. Só estou dizendo que tive problemas com duplex/velocidade e há pequenas partes da minha rede (ou seja, um de nossos racks de servidores) que possuem configurações principalmente manuais. Operamos uma LAN rigidamente controlada, com portas não utilizadas sendo desligadas e filtros MAC na maioria das portas, portanto, manter o controle das velocidades não é muito difícil.
Responder3
Acredito que se a negociação automática estivesse funcionando por uma hora por dia ou um mês e então por algum motivo "algo acontece" que definir o link para velocidade fixa "conserta", há um problema que não está sendo resolvido, mas sim contornado. Acho que vejo a configuração do link como uma solução temporária até que o problema real seja corrigido.
Responder4
A rede pela qual sou responsável (junto com alguns outros caras) é composta por cerca de 40 servidores, mais de 1.000 estações de trabalho (espalhadas por um campus bastante grande) e cerca de 1.000 WAPs também espalhados por uma grande área com vários tipos e idades. de equipamentos de rede.
Como disse dimitri.p, quando algo repentinamente não consegue interromper a negociação automática, geralmente é uma indicação de outro problema. Configurar a porta manualmente é o mesmo que colocar um curativo em alguém que foi esfaqueado no estômago – pode estancar o sangramento, mas certamente haverá danos por baixo.
Minha lista de verificação habitual:
- mudou alguma coisa na máquina? motoristas? Configurações no nível do sistema operacional ou do BIOS? Talvez o autoneg tenha sido desativado no sistema operacional?
- você trocou os cabos patch everificadoo cabo passa (se for um logner executado em vez de um rack?)
- você testou para ver se a porta do switch está ruim ou falhando?
- a NIC poderia estar com defeito?
Nós, via de regra,nuncadesabilite o autoneg nos servidores (ou qualquer outra coisa no data center), a menos que seja uma situação em que todas as outras causas possíveis foram eliminadas, movemos portas de switch, trocamos cabos, testamos a NIC, etc. Nesse caso, é documentado até a morte. Isso acontece muito raramente e geralmente com dispositivos aos quais não conseguimos acessar para verificar as configurações do BIOS e do sistema operacional.
As estações de trabalho e APs, por outro lado, são uma história diferente. A falha na negociação automática é um sinal clássico de mau funcionamento do cabo, e muitas vezes temos que definir manualmente a velocidade e o duplex até que chegue a temporada de verão de novos cabos nas paredes.