Ich habe einen kleinen Cluster, auf dem auf allen Knoten Ubuntu 12.04 LTS läuft. Ich habe vor Kurzem Ganglia eingerichtet, um den Cluster zu überwachen, und es funktioniert wunderbar, bis auf ein Problem. Ich wollte dem Monitor eine CPU-Temperaturmetrik hinzufügen, also habe ich eine „Temps“-Funktion in /usr/local/bin/ erstellt, die aus der folgenden Zeile besteht:
sensors|grep temp$1|awk '{print $2}'|grep -o '[0-9.]\+'
Anschließend habe ich meiner Crontab die folgenden Zeilen hinzugefügt, um die Temperatur alle 2 Minuten zu aktualisieren:
*/2 * * * * /usr/bin/gmetric --name temp1 --value `/usr/local/bin/temps 1` --type int16 --units Celcius
*/2 * * * * /usr/bin/gmetric --name temp2 --value `/usr/local/bin/temps 2` --type int16 --units Celcius
Nachdem ich das eingerichtet hatte, bemerkte ich, dass sich die Temperatur nie änderte. Es werden immer 27,8 für Temp1 und 29,8 für Temp2 angezeigt. Das ist, was „Sensoren“ unabhängig von der Belastung der Maschine melden. Hier ist die vollständige Ausgabe von „Sensoren“:
root@NUCTest:~# sensors
acpitz-virtual-0
Adapter: Virtual device
temp1: +27.8°C (crit = +106.0°C)
temp2: +29.8°C (crit = +106.0°C)
Was übersehe ich hier? Danke.
Antwort1
Ich habe es dank einiger Hinweise aus Braiams Kommentar zu meiner ursprünglichen Frage herausgefunden. Ich habe es noch einmal ausgeführt sensors-detect
und die Frage zum Hinzufügen der Zeilen zu mit „Ja“ beantwortet /etc/modules
. Ich glaube, ich habe beim ersten Mal die Standardeinstellung „Nein“ ausgewählt. Jetzt erhalte ich eine viel vollständigere Ausgabe von , sensors
die nicht virtuelle Geräte einschließt. Hier ist, was ich jetzt herausbekomme:
root@NUCTest:~# sensors
acpitz-virtual-0
Adapter: Virtual device
temp1: +27.8°C (crit = +106.0°C)
temp2: +29.8°C (crit = +106.0°C)
coretemp-isa-0000
Adapter: ISA adapter
Physical id 0: +35.0°C (high = +87.0°C, crit = +105.0°C)
Core 0: +33.0°C (high = +87.0°C, crit = +105.0°C)
Core 1: +36.0°C (high = +87.0°C, crit = +105.0°C)
nct6776-isa-0a30
Adapter: ISA adapter
Vcore: +0.65 V (min = +0.00 V, max = +1.74 V)
in1: +1.00 V (min = +0.00 V, max = +0.00 V) ALARM
AVCC: +3.36 V (min = +0.00 V, max = +0.00 V) ALARM
+3.3V: +3.34 V (min = +0.00 V, max = +0.00 V) ALARM
in4: +1.06 V (min = +0.00 V, max = +0.00 V) ALARM
in5: +0.00 V (min = +0.00 V, max = +0.00 V)
3VSB: +3.33 V (min = +0.00 V, max = +0.00 V) ALARM
Vbat: +3.28 V (min = +0.00 V, max = +0.00 V) ALARM
fan1: 0 RPM (min = 0 RPM) ALARM
fan2: 3183 RPM (min = 0 RPM) ALARM
SYSTIN: +65.0°C (high = +0.0°C, hyst = +0.0°C) ALARM sensor = thermistor
CPUTIN: +36.5°C (high = +80.0°C, hyst = +75.0°C) sensor = diode
AUXTIN: +87.0°C (high = +80.0°C, hyst = +75.0°C) ALARM sensor = thermistor
PECI Agent 0: +29.0°C
cpu0_vid: +2.050 V
intrusion0: ALARM
intrusion1: ALARM
Es ist interessant, dass das virtuelle Gerät immer noch da ist. Ich würde gerne erfahren, was das eigentlich ist.