概要と症状
システムの RAM が不足し、スワップ パーティションに多大な負荷がかかり始めると、システムがほぼ完全にフリーズします。マウスやキーボードを含むすべてがフリーズしますが、いくつかの例外があります。
- ハードドライブのライトはバックグラウンドアクティビティを示しているようです
- ファンが時々上下に回転し、CPUのアクティビティを示します。
nmap -sT
(TCPハンドシェイク) 別のマシンから、NICがOSIトランスポート層で応答していることを示す開いているポートが明らかになる
この原因を示すものは何も記録されません。
まれに、システムがフリーズしてから約 1 ~ 2 分後にマウスが少し動くようになったことを覚えています。この問題は、十分な空き RAM がある場合に必ず発生するわけではなく、スワップ パーティションに大きな負荷がかかり始めたときにのみ発生するようです。
以下は、空き RAM とスワップ ストレージを示す の出力ですfree
。現在、スワップの使用量はわずかです。これは通常、システムがフリーズする危険領域に入りますが、問題なく最大 12 MB のスワップが使用されるのを確認したことがあります。
合計RAM:32GB
合計スワップ:24GB
total used free shared buff/cache available
Mem: 31Gi 26Gi 1.7Gi 1.4Gi 3.5Gi 3.5Gi
Swap: 22Gi 3.9Gi 18Gi
何が原因か
このマシンを 5 年間使用していますが、この動作は過去 1 年以内に次の変更が行われてから発生し始めました。
- プロセッサをIntel i5からIntel Core i7 4790Kにアップグレードしました
- GPUをAsus 960 GTXからEVGA 2070 RTXにアップグレードしました
この動作の再現はかなり一貫しており、システムのメモリが不足するまでリクエストを送信するバックグラウンド Python プロセスを起動するスクリプトを作成しました。これにより、システム フリーズを 2 回連続で再現できました。
トラブルシューティングと軽減策
LinuxQuestions.org のこの古いスレッドこれは私の問題とほぼ同じで、この問題を軽減するために次のことを試しましたが、成功しませんでした。
- RAMタイミングを調整して電圧を下げる
- すべての DIMM を 1600MHz 周波数および 1.5 電圧仕様に交換しました (オーバークロックなし)
- BIOSファームウェアを更新しました
私が試した他のこと:
- スワップパーティションのSMARTロングテストとショートテスト
fsck
スワップパーティションのスキャン
システムの詳細
カーネル:Linux 5.4.0-73-汎用 #82-Ubuntu SMP / x86_64
ディスクとパーティション:
NAME MAJ:MIN RM SIZE RO TYPE MOUNTPOINT
sda 8:0 0 238.5G 0 disk
├─sda1 8:1 0 953M 0 part /boot/efi
├─sda2 8:2 0 28G 0 part /
└─sda3 8:3 0 209.6G 0 part /usr
sdb 8:16 0 1.8T 0 disk
├─sdb1 8:17 0 22.4G 0 part
├─sdb2 8:18 0 144.4G 0 part
├─sdb4 8:20 0 9.3G 0 part
├─sdb5 8:21 0 1.7T 0 part
└─isw_dhciiffhhj_Groovy 253:0 0 1.8T 0 dmraid
├─isw_dhciiffhhj_Groovy1 253:1 0 22.4G 0 part [SWAP]
├─isw_dhciiffhhj_Groovy2 253:2 0 144.4G 0 part /var
├─isw_dhciiffhhj_Groovy4 253:3 0 9.3G 0 part /srv
└─isw_dhciiffhhj_Groovy5 253:4 0 1.7T 0 part /home
sdc 8:32 0 1.8T 0 disk
├─sdc1 8:33 0 22.4G 0 part
├─sdc2 8:34 0 144.4G 0 part
├─sdc4 8:36 0 9.3G 0 part
├─sdc5 8:37 0 1.7T 0 part
└─isw_dhciiffhhj_Groovy 253:0 0 1.8T 0 dmraid
├─isw_dhciiffhhj_Groovy1 253:1 0 22.4G 0 part [SWAP]
├─isw_dhciiffhhj_Groovy2 253:2 0 144.4G 0 part /var
├─isw_dhciiffhhj_Groovy4 253:3 0 9.3G 0 part /srv
└─isw_dhciiffhhj_Groovy5 253:4 0 1.7T 0 part /home
sdd 8:48 0 465.8G 0 disk /opt
システム:
H/W path Device Class Description
=========================================================
system All Series (All)
/0 bus Z97-PRO GAMER
/0/0 memory 64KiB BIOS
/0/45 memory 32GiB System Memory
/0/45/0 memory 8GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/45/1 memory 8GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/45/2 memory 8GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/45/3 memory 8GiB DIMM DDR3 Synchronous 1333 MHz (0.8 ns)
/0/54 processor Intel(R) Core(TM) i7-4790K CPU @ 4.00GHz
/0/54/55 memory 256KiB L1 cache
/0/54/56 memory 1MiB L2 cache
/0/54/57 memory 8MiB L3 cache
/0/100 bridge 4th Gen Core Processor DRAM Controller
/0/100/1 bridge Xeon E3-1200 v3/4th Gen Core Processor PCI Express x16 Controller
/0/100/1.1 bridge Xeon E3-1200 v3/4th Gen Core Processor PCI Express x8 Controller
/0/100/1.1/0 display TU104 [GeForce RTX 2070 SUPER]
/0/100/1.1/0.1 multimedia TU104 HD Audio Controller
/0/100/1.1/0.2 bus TU104 USB 3.1 Host Controller
/0/100/1.1/0.2/0 usb5 bus xHCI Host Controller
/0/100/1.1/0.2/1 usb6 bus xHCI Host Controller
/0/100/1.1/0.3 bus TU104 USB Type-C UCSI Controller
/0/100/14 bus 9 Series Chipset Family USB xHCI Controller
/0/100/14/0 usb3 bus xHCI Host Controller
/0/100/14/0/4 input Back-UPS NS 1350M2 FW:954.e3 .D USB FW:e3
/0/100/14/0/9 input Gaming Mouse G502
/0/100/14/0/a input Corsair K70 RGB Gaming Keyboard
/0/100/14/0/d multimedia Blue Microphones
/0/100/14/0/e bus USB2.0 Hub
/0/100/14/0/e/2 multimedia Logitech Wireless Headset
/0/100/14/0/e/4 multimedia C922 Pro Stream Webcam
/0/100/14/1 usb4 bus xHCI Host Controller
/0/100/16 communication 9 Series Chipset Family ME Interface #1
/0/100/19 eno1 network Ethernet Connection (2) I218-V
/0/100/1a bus 9 Series Chipset Family USB EHCI Controller #2
/0/100/1a/1 usb1 bus EHCI Host Controller
/0/100/1a/1/1 bus USB hub
/0/100/1b multimedia 9 Series Chipset Family HD Audio Controller
/0/100/1c bridge 9 Series Chipset Family PCI Express Root Port 1
/0/100/1c.3 bridge 82801 PCI Bridge
/0/100/1c.3/0 bridge ASM1083/1085 PCIe to PCI Bridge
/0/100/1d bus 9 Series Chipset Family USB EHCI Controller #1
/0/100/1d/1 usb2 bus EHCI Host Controller
/0/100/1d/1/1 bus USB hub
/0/100/1f bridge Z97 Chipset LPC Controller
/0/100/1f.2 storage 9 Series Chipset Family SATA Controller [AHCI Mode]
/0/100/1f.3 bus 9 Series Chipset Family SMBus Controller
/0/1 system PnP device PNP0c01
/0/2 system PnP device PNP0c02
/0/3 system PnP device PNP0b00
/0/4 generic PnP device INT3f0d
/0/5 system PnP device PNP0c02
/0/6 system PnP device PNP0c02
/0/7 communication PnP device PNP0501
/0/8 system PnP device PNP0c02
/0/9 scsi0 storage
/0/9/0.0.0 /dev/sda disk 256GB Samsung SSD 850
/0/9/0.0.0/1 /dev/sda1 volume 952MiB Windows FAT volume
/0/9/0.0.0/2 /dev/sda2 volume 27GiB EFI partition
/0/9/0.0.0/3 /dev/sda3 volume 209GiB EFI partition
/0/a scsi2 storage
/0/a/0.0.0 /dev/sdb disk 2TB ST2000DM001-1ER1
/0/a/0.0.0/1 volume 22GiB Linux swap volume
/0/a/0.0.0/2 volume 144GiB EXT4 volume
/0/a/0.0.0/4 volume 9537MiB EFI partition
/0/a/0.0.0/5 volume 1686GiB EXT4 volume
/0/b scsi3 storage
/0/b/0.0.0 /dev/sdc disk 2TB ST2000DM001-1ER1
/0/b/0.0.0/1 volume 22GiB Linux swap volume
/0/b/0.0.0/2 volume 144GiB EXT4 volume
/0/b/0.0.0/4 volume 9537MiB EFI partition
/0/b/0.0.0/5 volume 1686GiB EXT4 volume
/0/c scsi4 storage
/0/c/0.0.0 /dev/sdd volume 465GiB Samsung SSD 860
/1 power To Be Filled By O.E.M.
/2 vethc2afe35 network Ethernet interface
この経験で私は意気消沈し、意気消沈してしまいました。この現象は頻繁に起こるため、生産性に重大な影響を及ぼします。システム全体を最初から最後まで入れ替えようかとも思いましたが、この問題が新しいシステムでも続くのではないかと疑っています。
答え1
システムの「フリーズ」は、実行しているプログラムが多すぎたり大きすぎたりして、使用可能なメモリが不足していることが原因であることが多いです。 を使用free
してスワップ領域があるかどうかを確認し、 を読み取ってman mkswap swapon fstab
作成します。スワップ領域は連続している必要があります。mkswap
ではfallocate
なく、または を使用dd
してください。従来、1.5 × RAM のスワップ領域が推奨されてきましたが、状況によって異なります。システムを休止状態にする予定がない場合は、1.0 × RAM 未満でもかまいません。