
Nosso provedor de colocation nos forneceu APCAP7932trocou PDUs 0U como parte de vários gabinetes que eles nos fornecem. Tivemos muitos problemas com o aspecto de gerenciamento de rede dessas PDUs, que descreverei a seguir. Estamos migrando para o espaço da gaiola no mesmo datacenter e compraremos nossas próprias PDUs para a gaiola. Gostaria de determinar quais PDUs de nível empresarial têm desempenho confiável do ponto de vista do gerenciamento remoto, para que não acabemos comprando algo que parece bom no papel, mas que é um pesadelo de usar.
Nossas PDUs fornecidas por colo são configuradas para oferecer suporte ao gerenciamento por meio de uma interface web SSL e via telnet. Atualizamos o firmware de todos eles para a versão atual em NOV2011. Eles respondem aos pings de maneira confiável e não temos motivos para suspeitar de um problema na camada de rede. No entanto, enfrentamos travamentos, tempos limite, desconexões e indisponibilidade geral frequentes do host de gerenciamento integrado em todas as PDUs. Ocasionalmente, temos que reiniciar o microcontrolador na PDU para nos recuperarmos do que parece ser uma falha grave ocasional. As tomadas permanecem ligadas (felizmente), mas o aspecto do gerenciamento é tão pouco confiável que se tornou uma responsabilidade operacional - não podemos ter certeza de que poderíamos entrar na PDU para desligar e ligar um host, se necessário. Temos 3 PDUs que exibem comportamento idêntico.
Existem muitos fabricantes de PDUs comutadas 0U de nível empresarial, todos com recursos comparáveis. Se eu olhasse a folha de dados de nossas PDUs atuais, elas pareceriam uma boa opção - somente com o benefício de sofrer ao usá-las é que saberemos como evitá-las. Gostaria de evitar escolher uma PDU que pareça boa no papel, mas que tenha problemas de confiabilidade semelhantes.
Qual tem sido a experiência de outras pessoas com PDUs comutadas? Esse nível de descamação é normal?
Responder1
O que você descreve não é normal, mais ou menos. No entanto, como você determina a disponibilidade? Você tem uma solução de monitoramento que faz ping/sondagem constante do dispositivo?
No passado, eu tinhaOpenNMSconfigurado para coletar dos meus dispositivos UPS e PDU da APC. Algumas das verificações, especificamente as sondagens http, ftp e telnet, causaram o tempo limite da interface de gerenciamento, criando interrupções de 30 a 60 segundos. Talvez seja isso que você está vendo.
No entanto, nunca tive problemas com a coleta de SNMP. Portanto, se for esse o caso, tente reduzir os impactos na interface de gerenciamento e concentre-se apenas em coletar o que você precisa.
Um trecho do meu gráfico de disponibilidade OpenNMS em uma interface APC