PDU 관리 인터페이스의 가용성이 낮음 - 제품 결함 또는 고립된 문제

PDU 관리 인터페이스의 가용성이 낮음 - 제품 결함 또는 고립된 문제

우리의 코로케이션 제공업체는 우리에게 APC를 제공했습니다.AP7932우리가 제공하는 여러 캐비닛의 일부로 0U PDU를 전환했습니다. 우리는 이러한 PDU의 네트워크 관리 측면에서 많은 어려움을 겪었습니다. 이에 대해서는 아래에서 설명하겠습니다. 우리는 동일한 데이터 센터의 케이지 공간으로 이동할 예정이며 케이지용 PDU를 자체적으로 구매할 예정입니다. 원격 관리 관점에서 어떤 엔터프라이즈급 PDU가 신뢰할 수 있는 성능을 발휘했는지 확인하여 서류상으로는 좋아 보이지만 사용하기에는 악몽인 제품을 구입하지 않도록 하고 싶습니다.

당사의 공동 제공 PDU는 SSL 웹 UI 및 텔넷을 통한 관리를 지원하도록 구성됩니다. 우리는 그들 모두의 펌웨어를 2011년 11월 현재 버전으로 업데이트했습니다. 핑에 안정적으로 응답하므로 네트워크 계층 문제를 의심할 이유가 없습니다. 그러나 모든 PDU에 내장된 관리 호스트에서 중단, 시간 초과, 연결 끊김 및 일반적인 사용 불가 현상이 자주 발생합니다. 가끔씩 발생하는 심각한 오류를 복구하기 위해 PDU의 마이크로컨트롤러를 다시 시작해야 하는 경우도 있습니다. 콘센트에는 전원이 계속 공급되지만(다행히도) 관리 측면이 너무 불안정하여 운영상의 책임이 되었습니다. 필요한 경우 PDU에 들어가서 호스트의 전원을 껐다가 다시 켤 수 있을지 확신할 수 없습니다. 모두 동일한 동작을 보이는 3개의 PDU가 있습니다.

엔터프라이즈급 0U 스위치 PDU 제조업체는 많으며 모두 유사한 기능을 갖추고 있습니다. 현재 PDU에 대한 데이터시트를 살펴보면 매우 적합할 것 같습니다. 사용하면서 겪게 되는 이점을 제외하고는 이를 피하는 방법을 알고 있습니다. 서류상으로는 괜찮아 보이지만 안정성 문제가 비슷한 PDU를 선택하는 것은 피하고 싶습니다.

스위치 PDU에 대한 다른 사람들의 경험은 어떠했습니까? 이 정도의 벗겨짐이 정상인가요?

답변1

당신이 묘사하는 것은 정상이 아닙니다. 그런데 가용성을 어떻게 결정합니까? 지속적으로 장치를 핑/프로빙하는 모니터링 솔루션이 있습니까?

예전에는오픈NMS내 APC UPS 및 PDU 장치에서 수집하도록 설정되었습니다. 일부 검사, 특히 http, ftp 및 telnet 프로브로 인해 관리 인터페이스가 시간 초과되어 30~60초 동안 중단이 발생했습니다. 어쩌면 그것이 당신이 보고 있는 것일 수도 있습니다.

그러나 SNMP 수집에 문제가 발생한 적은 없습니다. 따라서 이러한 경우에는 관리 인터페이스에 대한 히트를 줄이고 필요한 것만 수집하는 데 집중하십시오.

APC 인터페이스의 OpenNMS 가용성 차트에서 발췌 여기에 이미지 설명을 입력하세요

관련 정보