
在執行密集型任務(主要是遊戲,但也包括與科學數據分析相關的 GPU 計算)時,我的筆記型電腦會過熱並最終由於快速達到高溫(三分鐘左右超過 90°C)而關閉。我有兩個 GPU:整個系統預設使用的整合 Intel 卡,以及僅在需要更多「功率」時才使用的 NVIDIA 獨立 GPU(透過主要的)。我的獨立 GPU 工作到了極限,但不會過熱。只有在使用 NVIDIA GPU 時才會發生。因此,我花了幾週的時間來學習如何對我的卡進行降頻。
我設法在 nvidia-settings 中啟用降頻/超頻酷比特。然而,我主要面臨三個問題:(i)我能夠設定的最小偏移是-200 MHz,這還不夠。 (ii) 超頻在 nvidia-settings powermizer 面板中立即生效,但僅在 P3(具有最高 MHz 值)中生效,而降頻則不會。最後,(iii) 我有 4 個 GPUPerfMode(0 到 3),其中三個具有相同的最小值和最大值(請參見此處):
- 0:139-607
- 1:139-1911
- 2:139-1911
- 3:139-1911
因此,為了解決過熱問題,我需要對卡片進行降頻或將 GPUPerfModes 更改為更實際的值,也就是說,堅持令人滿意且不會導致極端溫度的性能水平。為什麼會出現上述問題(i、ii 和 iii)?我的設定檔有問題嗎?設定?有任何想法嗎?
完整的 nvidia 錯誤報告:nvidia-bug-report.log.gz(280.2 KB)
眼鏡:
- 戴爾 Inspiron 靈越 5480(擎天柱)
- 作業系統:Arch Linux x86_64
- 內核:5.7.12-arch1-1
- 德文:GNOME 3.36.4
- CPU:Intel i7-8565U (8) @ 4.600 GHz
- GPU:NVIDIA GeForce MX150(驅動
nvidia 450.57-6
,首先註意到驅動版本問題440.82-3
) - GPU:英特爾超高畫質顯示卡 620
答案1
Linux 中 NVIDIA 卡的電源管理非常糟糕,因此最好的選擇可能是將 GPU 限制在最低效能等級。
有兩種方法可以實現它,要么是一個 X.org 配置文件,您必須為其添加此配置文件(您可能需要重新啟動筆記型電腦以查看它是否有效):
Option "Coolbits" "28"
Option "RegistryDwords" "PowerMizerEnable=0x1; PerfLevelSrc=0x2222; PowerMizerLevel=0x3; PowerMizerDefault=0x3; PowerMizerDefaultAC=0x3"
如果它不起作用創建/etc/modprobe.d/nvidia.conf
options nvidia NVreg_RegistryDwords="OverrideMaxPerf=0x1"
並重新啟動(RegistryDwords
不再需要 X.org 選項)。
你的表現會很糟糕,但熱量應該是一流的。以後請在這裡詢問 NVIDIA Linux 相關問題:https://forums.developer.nvidia.com/c/gpu-unix-graphics/linux/148