Descripción general y síntomas
Mi sistema se congela casi por completo cada vez que se queda sin RAM y comienza a golpear fuertemente la partición de intercambio. Todo se congela, incluido el mouse y el teclado, con algunas excepciones:
- La luz del disco duro parece indicar alguna actividad en segundo plano.
- El ventilador a veces gira hacia arriba y hacia abajo, lo que indica cierta actividad de la CPU.
nmap -sT
(Apretón de enlace TCP) de otra máquina revela puertos abiertos que indican que la NIC está respondiendo en la capa de transporte OSI
No se registra nada que indique la causa de esto.
En una rara ocasión, recuerdo que el mouse pudo moverse un poco después de uno o dos minutos de congelarse el sistema. Este problema no parece ocurrir cuando hay suficiente RAM libre disponible, solo parece ocurrir cuando la partición de intercambio comienza a experimentar una carga significativa.
Aquí está el resultado free
que indica RAM libre y almacenamiento de intercambio, en este momento hay un uso de intercambio leve. Por lo general, esto implica ingresar a la zona de peligro donde el sistema se congelaría, aunque he sido testigo de hasta 12 MB de intercambio utilizados sin problemas.
RAM total:32GB
Intercambio total:24GB
total used free shared buff/cache available
Mem: 31Gi 26Gi 1.7Gi 1.4Gi 3.5Gi 3.5Gi
Swap: 22Gi 3.9Gi 18Gi
¿Qué podría estar causándolo?
He tenido esta máquina durante 5 años, pero este comportamiento comenzó a ocurrir el año pasado debido a los siguientes cambios:
- Se actualizó el procesador de Intel i5 a Intel Core i7 4790K
- Actualicé mi GPU de una Asus 960 GTX a una EVGA 2070 RTX
Reproducir este comportamiento es bastante consistente, escribí un script que activa procesos de Python en segundo plano que envían solicitudes hasta que el sistema se queda sin memoria. Pude reproducir el congelamiento del sistema dos veces seguidas al hacer esto.
Solución de problemas y mitigación
Este viejo hilo en LinuxQuestions.orgrefleja casi exactamente mi problema y he hecho lo siguiente para intentar mitigar este problema sin ningún éxito:
- Ajuste la sincronización de la RAM para reducir el voltaje.
- Se reemplazaron todos los DIMM con una frecuencia de 1600 MHz y una especificación de voltaje de 1,5 (sin overclocking)
- Actualizado el firmware del BIOS
Otras cosas que he probado:
- Pruebas SMART largas y cortas de la partición de intercambio
fsck
escaneo de la partición de intercambio
Detalles del sistema
Núcleo:Linux 5.4.0-73-genérico #82-Ubuntu SMP/x86_64
Discos y particiones:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 238.5G 0 disk
├─sda1 8:1 0 953M 0 part /boot/efi
├─sda2 8:2 0 28G 0 part /
└─sda3 8:3 0 209.6G 0 part /usr
sdb 8:16 0 1.8T 0 disk
├─sdb1 8:17 0 22.4G 0 part
├─sdb2 8:18 0 144.4G 0 part
├─sdb4 8:20 0 9.3G 0 part
├─sdb5 8:21 0 1.7T 0 part
└─isw_dhciiffhhj_Groovy 253:0 0 1.8T 0 dmraid
├─isw_dhciiffhhj_Groovy1 253:1 0 22.4G 0 part [SWAP]
├─isw_dhciiffhhj_Groovy2 253:2 0 144.4G 0 part /var
├─isw_dhciiffhhj_Groovy4 253:3 0 9.3G 0 part /srv
└─isw_dhciiffhhj_Groovy5 253:4 0 1.7T 0 part /home
sdc 8:32 0 1.8T 0 disk
├─sdc1 8:33 0 22.4G 0 part
├─sdc2 8:34 0 144.4G 0 part
├─sdc4 8:36 0 9.3G 0 part
├─sdc5 8:37 0 1.7T 0 part
└─isw_dhciiffhhj_Groovy 253:0 0 1.8T 0 dmraid
├─isw_dhciiffhhj_Groovy1 253:1 0 22.4G 0 part [SWAP]
├─isw_dhciiffhhj_Groovy2 253:2 0 144.4G 0 part /var
├─isw_dhciiffhhj_Groovy4 253:3 0 9.3G 0 part /srv
└─isw_dhciiffhhj_Groovy5 253:4 0 1.7T 0 part /home
sdd 8:48 0 465.8G 0 disk /opt
Sistema:
H/W path Device Class Description
=========================================================
system All Series (All)
/0 bus Z97-PRO GAMER
/0/0 memory 64KiB BIOS
/0/45 memory 32GiB System Memory
/0/45/0 memory 8GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/45/1 memory 8GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/45/2 memory 8GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/45/3 memory 8GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/54 processor Intel(R) Core(TM) i7-4790K CPU @ 4.00GHz
/0/54/55 memory 256KiB L1 cache
/0/54/56 memory 1MiB L2 cache
/0/54/57 memory 8MiB L3 cache
/0/100 bridge 4th Gen Core Processor DRAM Controller
/0/100/1 bridge Xeon E3-1200 v3/4th Gen Core Processor PCI Express x16 Controller
/0/100/1.1 bridge Xeon E3-1200 v3/4th Gen Core Processor PCI Express x8 Controller
/0/100/1.1/0 display TU104 [GeForce RTX 2070 SUPER]
/0/100/1.1/0.1 multimedia TU104 HD Audio Controller
/0/100/1.1/0.2 bus TU104 USB 3.1 Host Controller
/0/100/1.1/0.2/0 usb5 bus xHCI Host Controller
/0/100/1.1/0.2/1 usb6 bus xHCI Host Controller
/0/100/1.1/0.3 bus TU104 USB Type-C UCSI Controller
/0/100/14 bus 9 Series Chipset Family USB xHCI Controller
/0/100/14/0 usb3 bus xHCI Host Controller
/0/100/14/0/4 input Back-UPS NS 1350M2 FW:954.e3 .D USB FW:e3
/0/100/14/0/9 input Gaming Mouse G502
/0/100/14/0/a input Corsair K70 RGB Gaming Keyboard
/0/100/14/0/d multimedia Blue Microphones
/0/100/14/0/e bus USB2.0 Hub
/0/100/14/0/e/2 multimedia Logitech Wireless Headset
/0/100/14/0/e/4 multimedia C922 Pro Stream Webcam
/0/100/14/1 usb4 bus xHCI Host Controller
/0/100/16 communication 9 Series Chipset Family ME Interface #1
/0/100/19 eno1 network Ethernet Connection (2) I218-V
/0/100/1a bus 9 Series Chipset Family USB EHCI Controller #2
/0/100/1a/1 usb1 bus EHCI Host Controller
/0/100/1a/1/1 bus USB hub
/0/100/1b multimedia 9 Series Chipset Family HD Audio Controller
/0/100/1c bridge 9 Series Chipset Family PCI Express Root Port 1
/0/100/1c.3 bridge 82801 PCI Bridge
/0/100/1c.3/0 bridge ASM1083/1085 PCIe to PCI Bridge
/0/100/1d bus 9 Series Chipset Family USB EHCI Controller #1
/0/100/1d/1 usb2 bus EHCI Host Controller
/0/100/1d/1/1 bus USB hub
/0/100/1f bridge Z97 Chipset LPC Controller
/0/100/1f.2 storage 9 Series Chipset Family SATA Controller [AHCI Mode]
/0/100/1f.3 bus 9 Series Chipset Family SMBus Controller
/0/1 system PnP device PNP0c01
/0/2 system PnP device PNP0c02
/0/3 system PnP device PNP0b00
/0/4 generic PnP device INT3f0d
/0/5 system PnP device PNP0c02
/0/6 system PnP device PNP0c02
/0/7 communication PnP device PNP0501
/0/8 system PnP device PNP0c02
/0/9 scsi0 storage
/0/9/0.0.0 /dev/sda disk 256GB Samsung SSD 850
/0/9/0.0.0/1 /dev/sda1 volume 952MiB Windows FAT volume
/0/9/0.0.0/2 /dev/sda2 volume 27GiB EFI partition
/0/9/0.0.0/3 /dev/sda3 volume 209GiB EFI partition
/0/a scsi2 storage
/0/a/0.0.0 /dev/sdb disk 2TB ST2000DM001-1ER1
/0/a/0.0.0/1 volume 22GiB Linux swap volume
/0/a/0.0.0/2 volume 144GiB EXT4 volume
/0/a/0.0.0/4 volume 9537MiB EFI partition
/0/a/0.0.0/5 volume 1686GiB EXT4 volume
/0/b scsi3 storage
/0/b/0.0.0 /dev/sdc disk 2TB ST2000DM001-1ER1
/0/b/0.0.0/1 volume 22GiB Linux swap volume
/0/b/0.0.0/2 volume 144GiB EXT4 volume
/0/b/0.0.0/4 volume 9537MiB EFI partition
/0/b/0.0.0/5 volume 1686GiB EXT4 volume
/0/c scsi4 storage
/0/c/0.0.0 /dev/sdd volume 465GiB Samsung SSD 860
/1 power To Be Filled By O.E.M.
/2 vethc2afe35 network Ethernet interface
Esta experiencia me ha dejado desmoralizado y desinflado; ocurre con suficiente frecuencia como para afectar significativamente mi productividad. Me siento tentado a reemplazar todo el sistema de arriba a abajo, pero sospecho que este problema también me afectará al nuevo sistema.
Respuesta1
Los "congelamientos" del sistema a menudo se deben a la ejecución de demasiados programas demasiado grandes y a la falta de memoria disponible. Úselo free
para ver si tiene espacio de intercambio, lea man mkswap swapon fstab
para crear alguno. El espacio de intercambio debe ser contiguo. usar mkswap
o fallocate
no dd
. Tradicionalmente, se recomienda un espacio de intercambio de 1,5 × RAM, pero YMMV. Si no planeas hibernar tu sistema, puedes tener menos de 1,0 × RAM.