Estatísticas de taxa de falha para switches Cisco

Estatísticas de taxa de falha para switches Cisco

Temos esta rede com um núcleo de switches Cisco antigos e confiáveis. Tenho a sensação de que eles podem cair a qualquer momento; isso significará crise, pois este é o tipo de infraestrutura que:

eles conseguiram construir usando apenas pontos únicos de falha. Eu sei, você pensaria que alguma redundância aconteceria, mas não

Estou procurando dados estatísticos que mostrem a vida útil média do hardware de rede. Preciso de dados concretos para dar força aos meus argumentos.

Se isso ajudar, os Cisco mais antigos são da família 3500XL. Alguns deles morreram em um curto intervalo, alguns anos antes.

Responder1

Não é uma resposta direta, mas:

Eles parecem estar falhando? Isso pode parecer bobagem, mas os switches mais antigos podem ter ventiladores que soam muito ruins, e esse é um argumento forte: "Venha ouvir isso".

Compromisso, uma reserva fria:
Além disso, outra forma de abordar esta questão seria argumentar que embora o tempo de inatividade não valha a pena para eles implementarem redundância total, mas e quanto ao preço de uminterruptor únicoque você pode ter no rack como umreserva fria. Dessa forma, se alguém falhar, seutempo de recuperaçãoserá muito menos tempo.

Joel Spolsky mencionou isso em um dos podcasts stackoverflow, algo como "O tempo de recuperação é mais importante do que a frequência com que ele cai". O argumento é que, pelo que me lembro, o tempo de inatividade não é tão importante se você voltar em alguns minutos, mas é se você não voltar por meio dia. Maneira inteligente de ver isso, na minha opinião.

Então, seu novo argumento pode ser que, como os switches não sãoquecaro, é econômico para a empresa ter pelo menos um dispositivo de reserva, pois isso pode fazer a diferença entre ficar inativo por alguns minutos em vez de um dia inteiro.

Além disso, se você vencer a discussão dessa maneira, certifique-se de pré-configurar o cold spare ;-)

Responder2

Primeiro direi que adicionar redundância a uma rede a torna substancialmente mais complexa e se você não sabe o que está fazendo, pode não torná-la mais confiável. Às vezes, ter sorte é um bom plano. Não é o melhor plano, mas para quem assina os cheques pode parecer o melhor caminho a percorrer.

Presumirei que você tem uma pilha instável dessas coisas, não apenas algumas.

Como uma extensão da sugestão de Kyle de obter um sobressalente, que tal atualizar alguns dos dispositivos (e colocar os dispositivos de substituição em uma espécie de configuração de redundância vrrp / hsrp) e, em seguida, deixar de lado aqueles retirados de serviço para uso como sobressalentes para o outros ainda em serviço.

Além disso, elesfazertêm backups de todas as configurações de todos os seus dispositivos, certo? Essa é a prioridade número 1. Você pode, em caso de emergência, substituir um dispositivo L2 / L3 por outro, mas somente se souber o que o dispositivo antigo estava fazendo antes de falhar.

informação relacionada