Die Spannungen des Dual Xeon Servers sind niedrig

Die Spannungen des Dual Xeon Servers sind niedrig

Ich habe einen Whitebox-Server mit CentOS 5.7. Es ist ein Dual Xeon 5620 mit 24 GB RAM. Das Mainboard ist ein SuperMicro X8DT6-F und das Gehäuse ist ein SC825TQ-R720LPB. Zwei 720-W-Netzteile.

Wir hatten vor ein paar Wochen einen großen Stromausfall, bei dem alles herunterfiel. Ich habe für diesen Server keine Zahlen vor dem Stromausfall und der einzige Grund, warum sie mir aufgefallen sind, ist, dass ich die Server beim Hochfahren genauer überprüft habe als sonst.

https://i.stack.imgur.com/gPc0Z.png(Bild der Spannungswerte)

Wie Sie sehen können, ist CPU1 DIMM niedrig, +3,3 V ist hoch, 3,3 VSB ist hoch, +5 V ist hoch, +12 V ist WIRKLICH NIEDRIG (außerhalb der normalen 5 % (plus/minus)) ... und VBAT liegt außerhalb der Skala.

Mit meinem Whitebox-VAR haben wir Folgendes versucht:

  1. Tauschen Sie das Netzteil gegen ein anderes meiner Server mit denselben Netzteilen aus.
  2. Probieren Sie ein anderes Netzkabel aus
  3. Aktualisieren Sie die BMC/IPMI-Firmware, falls die Messwerte falsch waren (was nicht der Fall ist).
  4. BIOS aktualisieren
  5. Probieren Sie eine andere PDU aus
  6. Versuchen Sie es mit einer anderen Steckdose und/oder einem anderen Stromkreis.
  7. Ersetzte Spannungsreglereinheit

Zu diesem Zeitpunkt haben wir anscheinend nur noch nicht das Mainboard ausgetauscht. Dies wird der nächste Schritt sein, sofern nichts anderes Licht auf die Situation bringt.

Ich sollte erwähnen, dass das System ansonsten absolut zuverlässig ist, was überraschend ist, wenn man bedenkt, dass die 12-V-Spannung so weit daneben liegt.

Antwort1

Da Sie sagen, dass der Server absolut stabil und einwandfrei funktioniert und dass diese Spannungen deutlich abweichen, gehe ich davon aus, dass entweder die Überwachungssoftware die Spannungen falsch interpretiert oder die Sensoren nicht richtig funktionieren/defekt sind. Wenn dies die tatsächlichen Spannungen wären, hätte das System viele Probleme und die Batterie wäre wahrscheinlich durch Überladung beschädigt.

Ich gehe davon aus, dass Sie IPMI verwenden, um die Spannungswerte abzurufen. Da dies vom Hardwarehersteller gesteuert wird, ist es unwahrscheinlich, dass es falsch ist. Es bleiben also fehlerhafte Spannungssensoren, die bei den meisten Systemen in das Motherboard eingebaut sind.

Um diese Theorie zu testen, messen Sie mit einem Voltmeter die Batterie und die 12-V-Stromschienen. Da diese am weitesten entfernt sind, sollte es leicht zu erkennen sein, ob sie annähernd dem entsprechen, was die Sensoren melden.

Die Lösung besteht darin, entweder die Hauptplatine auszutauschen oder die Sensoren zu ignorieren und auf das Beste zu hoffen.

Antwort2

Durch das Zurücksetzen der BMC-Konfiguration wurden die Fehler auf den Sensoren behoben und jetzt funktioniert alles einwandfrei.

verwandte Informationen