La interfaz de administración de PDU tiene baja disponibilidad: falla del producto o problema aislado

La interfaz de administración de PDU tiene baja disponibilidad: falla del producto o problema aislado

Nuestro proveedor de colocación nos ha proporcionado APCAP7932PDU de 0U conmutadas como parte de varios gabinetes que nos proporcionan. Hemos tenido muchos problemas con el aspecto de administración de red de estas PDU, que describiré a continuación. Nos mudaremos al espacio de la jaula en el mismo centro de datos y compraremos nuestras propias PDU para la jaula. Me gustaría determinar qué PDU de nivel empresarial han tenido un desempeño confiable desde una perspectiva de administración remota para que no terminemos comprando algo que se ve bien en el papel pero que es una pesadilla de usar.

Nuestras PDU proporcionadas por colo están configuradas para admitir la administración a través de una interfaz de usuario web SSL y mediante telnet. Actualizamos el firmware de todos ellos a la versión actual a partir de noviembre de 2011. Responden a los pings de manera confiable y no tenemos motivos para sospechar que haya un problema en la capa de red. Sin embargo, experimentamos frecuentes bloqueos, tiempos de espera, desconexiones e indisponibilidad general del host de administración integrado en todas las PDU. Ocasionalmente tenemos que reiniciar el microcontrolador de la PDU para recuperarnos de lo que parece ser una falla grave ocasional. Los tomacorrientes permanecen encendidos (afortunadamente), pero el aspecto de administración es tan poco confiable que se ha convertido en una responsabilidad operativa: no podemos estar seguros de poder acceder a la PDU para encender y apagar un host si fuera necesario. Tenemos 3 PDU y todas exhiben un comportamiento idéntico.

Hay muchos fabricantes de PDU conmutadas 0U de nivel empresarial, todos con características comparables. Si mirara la hoja de datos de nuestras PDU actuales, parecerían encajar bien; solo con el beneficio de sufrir al usarlas sabemos cómo evitarlas. Me gustaría evitar elegir una PDU que se vea bien en papel, pero que tenga problemas de confiabilidad similares.

¿Cuál ha sido la experiencia de otros con las PDU conmutadas? ¿Es normal este nivel de descamación?

Respuesta1

Lo que describe no es normal, más o menos. Sin embargo, ¿cómo se determina la disponibilidad? ¿Tiene una solución de monitoreo que haga ping/sondee constantemente el dispositivo?

En el pasado, tuveAbiertoNMSconfigurado para recolectar de mis dispositivos UPS y PDU de APC. Algunas de las comprobaciones, específicamente las sondas http, ftp y telnet, provocaron que se agotara el tiempo de espera de la interfaz de administración, lo que generó interrupciones de 30 a 60 segundos. Quizás eso es lo que estás viendo.

Sin embargo, nunca he tenido problemas con la recopilación de SNMP. Entonces, si este es el caso, intente reducir los accesos a la interfaz de administración y concéntrese únicamente en recopilar lo que necesita.

Un extracto de mi tabla de disponibilidad de OpenNMS en una interfaz APC ingrese la descripción de la imagen aquí

información relacionada