Não é possível executar ping confiável no roteador 6224 a partir do sistema conectado diretamente

Não é possível executar ping confiável no roteador 6224 a partir do sistema conectado diretamente

OK, aqui está minha situação.

texto alternativo

Isso está na internet. O 6224 é o roteador nesta imagem e reside fisicamente em Kanata.

Tanto a VLAN 1697 quanto a 3994 são fornecidas por um provedor de serviços de Internet. Essas VLANs são fornecidas por meio de um único fio Ethernet de 1 Gb.

Os hosts Kanata estão diretamente conectados ao 6224; os outros dois sites são remotos.

A VLAN 3994 é um espaço de endereço IP único, portanto, teoricamente, não deveria importar fisicamente onde estão os hosts nessa sub-rede.

Aqui está o problema.

Eu tenho um sistema de monitoramento que está conectado à Internet, portanto, as sondagens do monitor entrariam neste diagrama na VLAN 1697.

Quando faço ping em hosts em Albert ou Bells Corners pela Internet, há 0 perdas. A conexão parece perfeita.

Quando faço ping em hosts no Kanata, perco de 10 a 40% dos pings. A perda não é previsível, mas: quando os perco, sempre perco pelo menos 3, geralmente 4, raramente mais, pings seguidos.

Anexei um monitor diretamente ao 6224 em Kanata no 3994.

Quando o monitor faz ping na interface de roteamento 6224, vejo exatamente o mesmo padrão de perda - mas NÃO ao mesmo tempo que a perda do sistema remoto. O tempo de ping é de cerca de 1ms.

Quando o monitor faz ping em outro sistema diretamente conectado ao 6224, há 0 perda. O tempo de ping é de cerca de 0,1 ms, um décimo do tempo de ping no roteador.

Alguém sabe o que está acontecendo aqui?

Atualize para tornar as coisas menos claras, talvez

O que parece estar acontecendo é que o tráfego que entra e sai da conexão do ISP está bom. O tráfego que vai do cérebro do roteador para o cérebro do switch (ou vice-versa, talvez) é o que está causando o problema.

Não posso culpar o ISP porque o acesso à Internet de/para os dois locais remotos é sólido. Somente os hosts diretamente conectados ao 6224 estão tendo problemas.

Atualização 2

OK, depois de muito tempo observando os rastros, tenho um sintoma mais específico.

Fiz um tcpdump na vlan 3994 do uplink do ISP procurando meu próprio endereço com base na teoria de que tudo que eu deveria ver é o tráfego de transmissão indo para sites remotos. Em vez disso, vi os pacotes que eu esperava ver na interface do meu sistema descendo o TLS nesta VLAN.

Então:

Por alguma razão, o 6224 frequentemente pensa que meu sistema está no extremo do TLS.

Quando inspeciono a tabela de comutação quando as coisas estão funcionando, minha entrada fica assim:

3994     0007.E924.F714        2/g16      Dynamic

…o que faz sentido, já que está conectado à porta 16. Porém, quando está quebrado, fica assim:

3994     0007.E924.F714        2/g22      Dynamic

Fluxos de pacotes mal direcionados parecem ser conduzidos por uma transmissão do meu sistema. No entanto, vejo uma transmissão saindo do meu sistema e duas na VLAN 3994 para o TLS. Geralmente é um Relatório de Associação / Grupo de Associação IGMP V2 224.0.0.251, mas às vezes é o chip de gerenciamento do meu sistema que funciona sozinho (ele faz isso a cada 2 segundos ou mais por motivos estúpidos).

Isto implica que existe um sistema em Bells Corners ou Albert que está ouvindo minha transmissão e repetindo-a por algum motivo. Então o 6224 diz ah, este mac deve realmente estar no link TLS e ajusta sua tabela de comutação de acordo.

Esta descrição do problema lembra alguma coisa?

Responder1

OK, descobri isso e vou escrever aqui. É improvável que esta solução específica ajude alguém porque é um caso extremo.

Na antiga história do link com este provedor, adicionamos uma segunda VLAN à principal. Na época, o provedor conectou esta VLAN como ambas marcadasenão marcado em seu lado da conexão. Seu switch trata os marcados e não marcados como conexões separadas.

Então o que acontece é que meu sistema conectado ao Dell emite uma transmissão arp (a interface de gerenciamento neste computador emite pacotes arp a cada meio segundo por motivos estúpidos), que o switch encaminha pelo link para o site remoto. O switch no provedor ouve a transmissão na interface não marcada -e envia de volta para mim na interface marcada. O switch ouve isso e conclui que o endereço MAC que origina a transmissão é realmente acessível através do link do provedor. Os pacotes de acompanhamento, portanto, são mal direcionados.

A solução foi fazer com que o provedor alterasse sua configuração para que concordasse com a da Dell. Todos os problemas gerais de conexão cessaram.

informação relacionada