我有一個在所有節點上運行 Ubuntu 12.04 LTS 的小型叢集。我最近設置了 ganglia 來監視集群,除了一個問題之外,它運行良好。我想在監視器中新增 CPU 溫度指標,因此我在 /usr/local/bin/ 中建立了一個「temps」函數,其中包含以下行:
sensors|grep temp$1|awk '{print $2}'|grep -o '[0-9.]\+'
然後,我將以下幾行加入 crontab 中,每 2 分鐘更新一次溫度:
*/2 * * * * /usr/bin/gmetric --name temp1 --value `/usr/local/bin/temps 1` --type int16 --units Celcius
*/2 * * * * /usr/bin/gmetric --name temp2 --value `/usr/local/bin/temps 2` --type int16 --units Celcius
設定完畢後,我注意到溫度沒有改變。它始終報告 temp1 為 27.8,temp2 為 29.8。這就是「感測器」所報告的內容,無論機器上的負載如何。這是「感測器」的完整輸出:
root@NUCTest:~# sensors
acpitz-virtual-0
Adapter: Virtual device
temp1: +27.8°C (crit = +106.0°C)
temp2: +29.8°C (crit = +106.0°C)
我在這裡缺少什麼?謝謝。
答案1
感謝 Braiam 對我最初問題的評論的一些指導,我明白了這一點。我重新運行sensors-detect
並對有關將行添加到 的問題回答是/etc/modules
。我想我第一次選擇了預設值“否”。現在我得到了更完整的輸出,sensors
其中包括非虛擬設備。這是我現在要說的:
root@NUCTest:~# sensors
acpitz-virtual-0
Adapter: Virtual device
temp1: +27.8°C (crit = +106.0°C)
temp2: +29.8°C (crit = +106.0°C)
coretemp-isa-0000
Adapter: ISA adapter
Physical id 0: +35.0°C (high = +87.0°C, crit = +105.0°C)
Core 0: +33.0°C (high = +87.0°C, crit = +105.0°C)
Core 1: +36.0°C (high = +87.0°C, crit = +105.0°C)
nct6776-isa-0a30
Adapter: ISA adapter
Vcore: +0.65 V (min = +0.00 V, max = +1.74 V)
in1: +1.00 V (min = +0.00 V, max = +0.00 V) ALARM
AVCC: +3.36 V (min = +0.00 V, max = +0.00 V) ALARM
+3.3V: +3.34 V (min = +0.00 V, max = +0.00 V) ALARM
in4: +1.06 V (min = +0.00 V, max = +0.00 V) ALARM
in5: +0.00 V (min = +0.00 V, max = +0.00 V)
3VSB: +3.33 V (min = +0.00 V, max = +0.00 V) ALARM
Vbat: +3.28 V (min = +0.00 V, max = +0.00 V) ALARM
fan1: 0 RPM (min = 0 RPM) ALARM
fan2: 3183 RPM (min = 0 RPM) ALARM
SYSTIN: +65.0°C (high = +0.0°C, hyst = +0.0°C) ALARM sensor = thermistor
CPUTIN: +36.5°C (high = +80.0°C, hyst = +75.0°C) sensor = diode
AUXTIN: +87.0°C (high = +80.0°C, hyst = +75.0°C) ALARM sensor = thermistor
PECI Agent 0: +29.0°C
cpu0_vid: +2.050 V
intrusion0: ALARM
intrusion1: ALARM
有趣的是,虛擬設備仍然存在。我很想知道那到底是什麼。