Eu tenho um pequeno cluster executando o Ubuntu 12.04 LTS em todos os nós. Recentemente configurei ganglia para monitorar o cluster e está funcionando perfeitamente, exceto por um problema. Eu queria adicionar uma métrica de temperatura da CPU ao monitor, então criei uma função 'temps' em /usr/local/bin/ que consiste na seguinte linha:
sensors|grep temp$1|awk '{print $2}'|grep -o '[0-9.]\+'
Em seguida, adicionei as seguintes linhas ao meu crontab para atualizar a temperatura a cada 2 minutos:
*/2 * * * * /usr/bin/gmetric --name temp1 --value `/usr/local/bin/temps 1` --type int16 --units Celcius
*/2 * * * * /usr/bin/gmetric --name temp2 --value `/usr/local/bin/temps 2` --type int16 --units Celcius
Depois de configurar isso, percebi que a temperatura nunca muda. Ele relata 27,8 para temp1 e 29,8 para temp2 o tempo todo. Isto é o que os 'sensores' relatam, independentemente da carga da máquina. Aqui está o resultado completo dos 'sensores':
root@NUCTest:~# sensors
acpitz-virtual-0
Adapter: Virtual device
temp1: +27.8°C (crit = +106.0°C)
temp2: +29.8°C (crit = +106.0°C)
O que estou perdendo aqui? Obrigado.
Responder1
Eu descobri graças a alguma orientação do comentário de Braiam sobre minha pergunta original. Executei novamente sensors-detect
e respondi sim à pergunta sobre como adicionar as linhas ao arquivo /etc/modules
. Acho que selecionei o padrão não na primeira vez. Agora obtenho uma saída muito mais completa sensors
que inclui dispositivos não virtuais. Aqui está o que estou divulgando agora:
root@NUCTest:~# sensors
acpitz-virtual-0
Adapter: Virtual device
temp1: +27.8°C (crit = +106.0°C)
temp2: +29.8°C (crit = +106.0°C)
coretemp-isa-0000
Adapter: ISA adapter
Physical id 0: +35.0°C (high = +87.0°C, crit = +105.0°C)
Core 0: +33.0°C (high = +87.0°C, crit = +105.0°C)
Core 1: +36.0°C (high = +87.0°C, crit = +105.0°C)
nct6776-isa-0a30
Adapter: ISA adapter
Vcore: +0.65 V (min = +0.00 V, max = +1.74 V)
in1: +1.00 V (min = +0.00 V, max = +0.00 V) ALARM
AVCC: +3.36 V (min = +0.00 V, max = +0.00 V) ALARM
+3.3V: +3.34 V (min = +0.00 V, max = +0.00 V) ALARM
in4: +1.06 V (min = +0.00 V, max = +0.00 V) ALARM
in5: +0.00 V (min = +0.00 V, max = +0.00 V)
3VSB: +3.33 V (min = +0.00 V, max = +0.00 V) ALARM
Vbat: +3.28 V (min = +0.00 V, max = +0.00 V) ALARM
fan1: 0 RPM (min = 0 RPM) ALARM
fan2: 3183 RPM (min = 0 RPM) ALARM
SYSTIN: +65.0°C (high = +0.0°C, hyst = +0.0°C) ALARM sensor = thermistor
CPUTIN: +36.5°C (high = +80.0°C, hyst = +75.0°C) sensor = diode
AUXTIN: +87.0°C (high = +80.0°C, hyst = +75.0°C) ALARM sensor = thermistor
PECI Agent 0: +29.0°C
cpu0_vid: +2.050 V
intrusion0: ALARM
intrusion1: ALARM
É interessante que o dispositivo virtual ainda esteja lá. Eu adoraria saber o que isso realmente é.