График изменения температуры с течением времени для HP iLo 4

График изменения температуры с течением времени для HP iLo 4

Сервер: HP DL380p Gen 8, работающий под управлением последней версии iLo 4.

Один датчик, датчик № 25 для контроллера HD, имеет тенденцию немного нагреваться по сравнению с другими датчиками. Он имеет тенденцию показывать 75 C. Температура предупреждения составляет 100 C. Критическая температура — «N/A». Это всегда мой самый горячий датчик.

Первый,стоит ли беспокоиться об этом датчике? Если нет, то моя проблема решена.

Во-вторых, если этот датчик требует мониторинга, не могли бы вы помочь мне с мониторингом? Периодически я обновляю веб-страницу iLo 4, которая показывает мне температуру. Было бы гораздо удобнее, если бы я мог просматривать историю предыдущих показаний. (В идеале график, но CSV тоже подойдет).

Спасибо за ваше время и помощь. Я буду рад предоставить дополнительную информацию, если таковая потребуется.

решение1

Есть миллион разных способов контролировать это, используйте scom, nagios, splunk, solarwinds и т. д. список можно продолжать и продолжать. Если у вас больше, чем несколько серверов, я бы использовал nagios для мониторинга таких вещей.

решение2

Периодически извлекайте данные датчика с помощью IPMI. Используйте RRDTool для построения графика.

видетьздесь:

решение3

Я не согласен с предложениями построить график этого датчика. Датчик № 25 на вашей платформе — это датчик температуры системной платы. Он обычно колеблется в районе 70–80 градусов по Цельсию. Это не проблема. Эти системы хорошо реагируют на изменения температуры, и пока вы контролируете окружающую среду, я не вижу проблемы. Если вы параноик, вы можете настроить систему на работу сУсиленное охлаждениеустанавливается в BIOS. Обычно он предназначен для работы с картами PCIe сторонних производителей или при работе в неидеальных условиях, но это вариант.

Если на данный момент в вашей системе не установлено управление оповещениями, вам следует сделать это с помощью инструментов HP. По крайней мере, вы получите оповещение по электронной почте... Эту информацию вы также можете получить из операционной системы.

Trap-ID=6018

Температура сервера выходит за пределы нормального рабочего диапазона. Система будет отключена.

Типичный выходной сигнал температуры DL380p Gen8:

# hplog  -t
ID     TYPE        LOCATION      STATUS    CURRENT  THRESHOLD 
 1  Basic Sensor Ambient         Normal    64F/ 18C 107F/ 42C 
 2  Basic Sensor CPU (1)         Normal   104F/ 40C 158F/ 70C 
 3  Basic Sensor CPU (2)         Normal   ---F/---C 158F/ 70C 
 4  Basic Sensor Memory Board    Normal    78F/ 26C 188F/ 87C 
 5  Basic Sensor Memory Board    Normal    77F/ 25C 188F/ 87C 
 6  Basic Sensor Memory Board    Normal    80F/ 27C 188F/ 87C 
 7  Basic Sensor Memory Board    Normal    82F/ 28C 188F/ 87C 
 8  Basic Sensor Memory Board    Normal   ---F/---C 188F/ 87C 
 9  Basic Sensor Memory Board    Normal   ---F/---C 188F/ 87C 
10  Basic Sensor Memory Board    Normal   ---F/---C 188F/ 87C 
11  Basic Sensor Memory Board    Normal   ---F/---C 188F/ 87C 
12  Basic Sensor System Board    Normal    95F/ 35C 140F/ 60C 
13  Basic Sensor System Board    Normal   111F/ 44C 221F/105C 
14  Basic Sensor Pwr. Supply Bay Normal    73F/ 23C ---F/---C 
15  Basic Sensor Pwr. Supply Bay Normal    73F/ 23C ---F/---C 
16  Basic Sensor Pwr. Supply Bay Normal    75F/ 24C 167F/ 75C 
17  Basic Sensor Pwr. Supply Bay Normal    87F/ 31C 239F/115C 
18  Basic Sensor Pwr. Supply Bay Normal    78F/ 26C 239F/115C 
19  Basic Sensor Pwr. Supply Bay Normal    78F/ 26C 239F/115C 
20  Basic Sensor Pwr. Supply Bay Normal    86F/ 30C 239F/115C 
21  Basic Sensor Pwr. Supply Bay Normal    77F/ 25C 239F/115C 
22  Basic Sensor Pwr. Supply Bay Normal    78F/ 26C 239F/115C 
23  Basic Sensor Pwr. Supply Bay Normal    84F/ 29C 194F/ 90C 
24  Basic Sensor Pwr. Supply Bay Normal    75F/ 24C 194F/ 90C 
25  Basic Sensor System Board    Normal   158F/ 70C 212F/100C 
26  Basic Sensor System Board    Normal    89F/ 32C 194F/ 90C 
27  Basic Sensor I/O Zone        Normal   ---F/---C 212F/100C 
28  Basic Sensor I/O Zone        Normal   ---F/---C 212F/100C 
29  Basic Sensor I/O Zone        Normal   ---F/---C 212F/100C 
30  Basic Sensor I/O Zone        Normal   ---F/---C 212F/100C 
31  Basic Sensor I/O Zone        Normal   ---F/---C 212F/100C 
32  Basic Sensor I/O Zone        Normal   ---F/---C 212F/100C 
33  Basic Sensor I/O Zone        Normal   ---F/---C 212F/100C 
34  Basic Sensor I/O Zone        Normal    78F/ 26C 149F/ 65C 
35  Basic Sensor I/O Zone        Normal    80F/ 27C 150F/ 66C 
36  Basic Sensor I/O Zone        Normal    80F/ 27C 150F/ 66C 
37  Basic Sensor I/O Zone        Normal   ---F/---C 149F/ 65C 
38  Basic Sensor I/O Zone        Normal   ---F/---C 149F/ 65C 
39  Basic Sensor I/O Zone        Normal   ---F/---C 149F/ 65C 
40  Basic Sensor I/O Zone        Normal    89F/ 32C 150F/ 66C 
41  Basic Sensor I/O Zone        Normal   ---F/---C 150F/ 66C 
42  Basic Sensor Pwr. Supply Bay Normal    75F/ 24C 203F/ 95C 
43  Basic Sensor System Board    Normal   104F/ 40C 194F/ 90C 
44  Basic Sensor System Board    Normal    86F/ 30C 176F/ 80C 
45  Basic Sensor System Board    Normal    62F/ 17C 149F/ 65C 
46  Basic Sensor System Board    Normal    86F/ 30C 167F/ 75C 
47  Basic Sensor System Board    Normal    82F/ 28C 167F/ 75C 
48  Basic Sensor System Board    Normal    89F/ 32C 167F/ 75C 
49  Basic Sensor Chassis         Normal    84F/ 29C 167F/ 75C 
50  Basic Sensor Chassis         Normal    86F/ 30C 167F/ 75C 

Связанный контент