
Temos uma árvore de rede de escritório plana construída em vários switches ProCurve L2 e L3 GigE diferentes que abrangem cerca de 300 portas. Hoje descobri que um dos dispositivos da rede por um curto período de tempo causa transmissão excessiva que causa saturação na maioria dos links de 100Mbps afetando determinados serviços como VoIP. O dispositivo está conectado ao switch ProCurve 3500yl, que é o switch raiz da rede e, portanto, a tempestade se espalha através do switch raiz para o resto da rede.
P:Existe uma maneira de localizar o problema e evitar que a tempestade se espalhe pelo switch raiz?
Aqui estão mais alguns detalhes do meu caso que podem ser relevantes, pois posso estar fazendo uma pergunta errada e a melhor solução pode estar em outro lugar.
O dispositivo que causa a tempestade é um switch PoE ProCurve 3400cl (J4905A) com uma versão de firmware desatualizada M.10.76
de 2009.Eu sei que é antigo, vou mostrar o mais novo no fim de semana.
O 3400cl está conectado a uma fonte de energia que apresenta interrupções prolongadas e intermitentes. Quando a energia é reiniciada após uma queda de energia, o dispositivo leva cerca de 5 minutos para inicializar. Neste momento o tráfego flui através do dispositivo enquanto o dispositivo e seus links ainda não estão completamente configurados. Durante esse período, ele lança na rede todo tipo de tráfego indesejado que é difícil de capturar, mas que deixa um pico nas estatísticas coletadas pelo SNMP.
Durante esse período, vejo High collision or drop rate. See help.
mensagens em muitas portas de 100 Mbps na rede.
O 3400cl é conectado por dois links GigE físicos ao 3500yl. O 3400cl está executando o RSTP enquanto o 3500yl está configurado com o protocolo spanning tree MSTP. Durante a operação normal, um dos links é desabilitado pelo RSTP no 3400cl enquanto o outro está encaminhando.
Quando o 3400cl é reinicializado, posso ver as seguintes mensagens nos logs do 3500yl
14:05:03 ... port 37 is now off-line
14:05:04 ... port 38 is now off-line
14:05:51 ... port 37 is blocked by STP
14:05:51 ... port 38 is blocked by STP
14:05:54 ... port 37 is now on-line
14:05:54 ... port 38 is now on-line
e então estou vendo High collision or drop rate
portas de 100 Mbps conectadas ao 3500yl e os switches de nível inferior conectados a ele.
14:07:11 ... port NN-High collision or drop rate. See help.
Além disso, os usuários de VoIP estão enfrentando interrupções.
A única medida imediata que pude tentar foi definir broadcast-limit 5
o par de portas 3500yl. Não tenho certeza e não pude testar se isso vai ajudar. Também parece muito com umAd hocsolução.