Temperaturas de CPU

Temperaturas de CPU

Estoy usando Ubuntu 20.04 en una computadora de escritorio Intel i9 Core 16Gb RAM Placa base ASUS. A veces, cuando ejecuto aplicaciones como OBS Studio, Skype, Chrome, etc., mi computadora se reinicia repentinamente. No sé el motivo y no pude encontrar un artículo adecuado que pueda ayudar a resolver este problema. A continuación explico mis intentos en un intento de descubrir posibles problemas con mi hardware.

El resultado después de escribir last reboot, que muestra que mi ejecución anterior de Ubuntu aparece como "aún en ejecución" después del reinicio inesperado:

reboot   system boot  5.4.0-42-generic Wed Aug 26 11:00   still running
reboot   system boot  5.4.0-42-generic Tue Aug 25 06:20   still running
reboot   system boot  5.4.0-42-generic Mon Aug 24 06:38 - 00:06  (17:28)
reboot   system boot  5.4.0-42-generic Sun Aug 23 18:52 - 23:36  (04:44)
reboot   system boot  5.4.0-42-generic Sun Aug 23 06:32 - 23:36  (17:04)
reboot   system boot  5.4.0-42-generic Thu Aug 20 09:42 - 18:17 (2+08:35)
reboot   system boot  5.4.0-42-generic Mon Aug 17 21:55 - 22:22  (00:26)
reboot   system boot  5.4.0-42-generic Mon Aug 17 09:22 - 21:55  (12:33)
reboot   system boot  5.4.0-42-generic Mon Aug 17 09:00 - 21:55  (12:54)
reboot   system boot  5.4.0-42-generic Mon Aug 17 08:55 - 21:55  (12:59)
reboot   system boot  5.4.0-42-generic Mon Aug 17 05:56 - 07:37  (01:40)
reboot   system boot  5.4.0-42-generic Mon Aug 17 05:34 - 07:37  (02:02)
reboot   system boot  5.4.0-42-generic Sun Aug 16 21:09 - 00:07  (02:58)
reboot   system boot  5.4.0-42-generic Sun Aug 16 20:52 - 21:09  (00:17)
reboot   system boot  5.4.0-42-generic Sun Aug 16 20:38 - 20:51  (00:12)
reboot   system boot  5.4.0-42-generic Sun Aug 16 20:14 - 20:38  (00:23)
reboot   system boot  5.4.0-42-generic Sun Aug 16 20:05 - 20:38  (00:33)
reboot   system boot  5.4.0-42-generic Sun Aug 16 19:31 - 20:38  (01:07)
reboot   system boot  5.4.0-42-generic Sun Aug 16 18:39 - 19:30  (00:51)
reboot   system boot  5.4.0-42-generic Sun Aug 16 18:27 - 18:38  (00:11)
reboot   system boot  5.4.0-42-generic Sun Aug 16 18:22 - 18:27  (00:04)
reboot   system boot  5.4.0-42-generic Sun Aug 16 18:18 - 18:27  (00:08)
reboot   system boot  5.4.0-42-generic Sun Aug 16 18:16 - 18:27  (00:10)
reboot   system boot  5.4.0-42-generic Sun Aug 16 18:11 - 18:27  (00:15)
reboot   system boot  5.4.0-42-generic Sun Aug 16 16:42 - 18:11  (01:28)
reboot   system boot  5.4.0-42-generic Sun Aug 16 16:30 - 16:42  (00:11)
reboot   system boot  5.4.0-42-generic Sun Aug 16 16:22 - 16:30  (00:08)
reboot   system boot  5.4.0-42-generic Sun Aug 16 16:13 - 16:22  (00:08)
reboot   system boot  5.4.0-42-generic Sun Aug 16 15:50 - 16:13  (00:23)
reboot   system boot  5.4.0-42-generic Sun Aug 16 15:46 - 16:13  (00:27)
reboot   system boot  5.4.0-42-generic Sun Aug 16 14:01 - 15:42  (01:41)
reboot   system boot  5.4.0-42-generic Sun Aug 16 13:50 - 14:00  (00:09)

La configuración de hardware de la computadora se proporciona a continuación:

00:01.0 PCI bridge: Intel Corporation Xeon E3-1200 v5/E3-1500 v5/6th Gen Core Processor PCIe Controller (x16) (rev 0d)
00:02.0 VGA compatible controller: Intel Corporation UHD Graphics 630 (Desktop 9 Series) (rev 02)
00:14.0 USB controller: Intel Corporation 200 Series/Z370 Chipset Family USB 3.0 xHCI Controller
00:16.0 Communication controller: Intel Corporation 200 Series PCH CSME HECI #1
00:17.0 SATA controller: Intel Corporation 200 Series PCH SATA controller [AHCI mode]
00:1c.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #5 (rev f0)
00:1c.7 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #8 (rev f0)
00:1d.0 PCI bridge: Intel Corporation 200 Series PCH PCI Express Root Port #11 (rev f0)
00:1f.0 ISA bridge: Intel Corporation Device a2ca
00:1f.2 Memory controller: Intel Corporation 200 Series/Z370 Chipset Family Power Management Controller
00:1f.3 Audio device: Intel Corporation 200 Series PCH HD Audio
00:1f.4 SMBus: Intel Corporation 200 Series/Z370 Chipset Family SMBus Controller
01:00.0 VGA compatible controller: NVIDIA Corporation GK208 [GeForce GT 710] (rev a1)
01:00.1 Audio device: NVIDIA Corporation GF119 HDMI Audio Controller (rev a1)
03:00.0 Ethernet controller: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller (rev 15)

Cuando instalé Ubuntu por primera vez, intenté varias veces hacer que un controlador Nvidia funcionara, pero alguno de los controladores oficiales de nvidia logró reconocer mis tarjetas nvidia. Por lo tanto, actualmente estoy ejecutando el controlador Noveau.

Realicé una prueba de esfuerzo en mi CPU usando la herramienta stress-ngy la instalé powertoppara verificar el consumo de energía de mis dispositivos de hardware. Mi computadora está conectada a un no-break (600 Va) y el consumo máximo de energía de mi hardware durante la prueba de esfuerzo es de 104W. Según sensors, la temperatura de los núcleos de mi CPU durante la prueba de estrés es:

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +92.0°C  (high = +86.0°C, crit = +100.0°C)
Core 0:        +91.0°C  (high = +86.0°C, crit = +100.0°C)
Core 1:        +87.0°C  (high = +86.0°C, crit = +100.0°C)
Core 2:        +92.0°C  (high = +86.0°C, crit = +100.0°C)
Core 3:        +91.0°C  (high = +86.0°C, crit = +100.0°C)
Core 4:        +92.0°C  (high = +86.0°C, crit = +100.0°C)
Core 5:        +91.0°C  (high = +86.0°C, crit = +100.0°C)
Core 6:        +89.0°C  (high = +86.0°C, crit = +100.0°C)
Core 7:        +89.0°C  (high = +86.0°C, crit = +100.0°C)

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +27.8°C  (crit = +119.0°C)
temp2:        +29.8°C  (crit = +119.0°C)

El resultado de powertopdurante la misma prueba de estrés:

System baseline power is estimated at 104 W

Power est.    Usage     Device name
  85.4 W     1065%        CPU core
  9.68 W     1065%        CPU misc
  1.01 W     1065%        DRAM
            100,0%        PCI Device: NVIDIA Corporation GK208 [GeForce GT 710]
            100,0%        USB device: xHCI Host Controller
            100,0%        USB device: USB Optical Mouse (Logitech)
            100,0%        USB device: USB Keyboard (USB)
            100,0%        PCI Device: Intel Corporation 200 Series/Z370 Chipset Family Power Management Controller
            100,0%        PCI Device: Realtek Semiconductor Co., Ltd. RTL8111/8168/8411 PCI Express Gigabit Ethernet Controller
            100,0%        PCI Device: Intel Corporation 200 Series PCH SATA controller [AHCI mode]
            100,0%        PCI Device: Intel Corporation 200 Series PCH PCI Express Root Port #5
            100,0%        PCI Device: Intel Corporation Device a2ca
            100,0%        PCI Device: Intel Corporation Xeon E3-1200 v5/E3-1500 v5/6th Gen Core Processor PCIe Controller (x16)
            100,0%        PCI Device: Intel Corporation 200 Series PCH PCI Express Root Port #8
            100,0%        PCI Device: Intel Corporation 200 Series PCH HD Audio
            100,0%        PCI Device: Intel Corporation 8th Gen Core 8-core Desktop Processor Host Bridge/DRAM Registers [Coffee
            100,0%        PCI Device: Intel Corporation 200 Series PCH PCI Express Root Port #11
            100,0%        PCI Device: Intel Corporation UHD Graphics 630 (Desktop 9 Series)
            100,0%        PCI Device: Intel Corporation 200 Series/Z370 Chipset Family USB 3.0 xHCI Controller
            100,0%        Audio codec hwC0D0: Realtek
             18,6 pkts/s  Network interface: enp3s0 (r8169)

¿Alguien puede darme una pista de lo que está pasando con mi computadora? ¡Aprecio las sugerencias!

¡Gracias!

Respuesta1

Temperaturas de CPU

La stress-ngherramienta muestra que las temperaturas de la CPU son de 87,0 °C a 92,0 °C (casi 200 °F) para las 8 CPU. Estas temperaturas destruirán tu máquina.

Verifique que sus ventiladores estén cableados, conectados y funcionando correctamente.

Verifique su BIOS para obtener configuraciones de VENTILADOR personalizadas.

¡Baja esas temperaturas lo antes posible!

overclocking

Si su CPU o RAM están overclockeadas, devuélvalas a los valores predeterminados.

BIOS

ASUSTeK PRIME H310M-E R2.0/BR

Tiene la versión de BIOS 1402, con fecha del 21/05/2020.

Hay un BIOS más nuevo disponible, versión 1605, con fecha del 14/08/2020, y se puede descargaraquí.

Nota: Verifique que tenga la página web correcta para su placa base.

Nota: Tenga buenas copias de seguridad antes de actualizar el BIOS.

NVIDIA

NVIDIA Corporación GK208 [GeForce GT 710]

Respecto a los problemas de Nvidia... el controlador actual es la versión 450.66 y se puede descargaraquí.

Confirme que el arranque seguro esté deshabilitado en el BIOS.

Elimine todos los controladores actuales de Nvidia y luego instale los nuevos controladores.

ingrese la descripción de la imagen aquí

ingrese la descripción de la imagen aquí

Actualización n.º 1:

El mensaje que recibe del controlador Nvidia indica que 450.66 no es compatible con su tarjeta de video, por lo tanto, no funcionan en su configuración. Deberá comunicarse con el soporte de Nvidia para preguntar qué controlador usar. Hasta entonces, seleccione el controlador de video Nouveau y luego elimine todas las cosas de Nvidia nuevamente.

Respuesta2

la salida de ps auxc | grep thermes:

root         228  0.0  0.0      0     0 ?        I<   07:39   0:00 acpi_thermal_pm
root         872  0.0  0.0 134500  9892 ?        Ssl  07:40   0:00 thermald

Actualicé con éxito la versión del BIOS e instalé el controlador Nvidia 450, pero la computadora se reinició sola durante la instalación.

La temperatura de mi computadora cuando está inactiva se detalla a continuación:

sensors
nct6796-isa-0290
Adapter: ISA adapter
Vcore:                    328.00 mV (min =  +0.00 V, max =  +1.74 V)
in1:                        1.02 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
AVCC:                       3.39 V  (min =  +2.98 V, max =  +3.63 V)
+3.3V:                      3.41 V  (min =  +2.98 V, max =  +3.63 V)
in4:                        1.02 V  (min =  +0.00 V, max =  +0.00 V)  ALARM
in5:                      160.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in6:                      128.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
3VSB:                       3.39 V  (min =  +2.98 V, max =  +3.63 V)
Vbat:                       3.17 V  (min =  +2.70 V, max =  +3.63 V)
in9:                      1000.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in10:                     152.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in11:                     128.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in12:                     144.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in13:                     128.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
in14:                     136.00 mV (min =  +0.00 V, max =  +0.00 V)  ALARM
fan1:                        0 RPM  (min =    0 RPM)
fan2:                     1220 RPM  (min =    0 RPM)
fan3:                        0 RPM  (min =    0 RPM)
fan4:                        0 RPM  (min =    0 RPM)
fan5:                        0 RPM  (min =    0 RPM)
fan7:                        0 RPM  (min =    0 RPM)
SYSTIN:                    +32.0°C  (high = +98.0°C, hyst = +95.0°C)  sensor = thermistor
CPUTIN:                    +31.5°C  (high = +80.0°C, hyst = +75.0°C)  sensor = thermistor
AUXTIN0:                  +110.0°C    sensor = thermistor
AUXTIN1:                  +115.0°C    sensor = thermistor
AUXTIN2:                  +114.0°C    sensor = thermistor
AUXTIN3:                  +115.0°C    sensor = thermistor
PECI Agent 0:              +34.0°C  (high = +98.0°C, hyst = +95.0°C)
                                    (crit = +100.0°C)
PECI Agent 0 Calibration:  +31.5°C  
PCH_CHIP_CPU_MAX_TEMP:      +0.0°C  
PCH_CHIP_TEMP:              +0.0°C  
intrusion0:               OK
intrusion1:               ALARM
beep_enable:              disabled

acpitz-acpi-0
Adapter: ACPI interface
temp1:        +27.8°C  (crit = +119.0°C)
temp2:        +29.8°C  (crit = +119.0°C)

coretemp-isa-0000
Adapter: ISA adapter
Package id 0:  +38.0°C  (high = +86.0°C, crit = +100.0°C)
Core 0:        +35.0°C  (high = +86.0°C, crit = +100.0°C)
Core 1:        +34.0°C  (high = +86.0°C, crit = +100.0°C)
Core 2:        +38.0°C  (high = +86.0°C, crit = +100.0°C)
Core 3:        +35.0°C  (high = +86.0°C, crit = +100.0°C)
Core 4:        +33.0°C  (high = +86.0°C, crit = +100.0°C)
Core 5:        +34.0°C  (high = +86.0°C, crit = +100.0°C)
Core 6:        +35.0°C  (high = +86.0°C, crit = +100.0°C)
Core 7:        +34.0°C  (high = +86.0°C, crit = +100.0°C)

Después de reiniciar, vi que se instaló el controlador Nvidia 450, pero cuando escribo nvidia-smi, recibo el mensaje:

NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver. Make sure that the latest NVIDIA driver is installed and running.

Pd.: esta computadora es novedosa... la adquirí hace dos semanas.

información relacionada