GPU 過熱:調整 Nvidia GPUPerfModes 或降頻:無法編輯其中任何一個

GPU 過熱:調整 Nvidia GPUPerfModes 或降頻:無法編輯其中任何一個

在執行密集型任務(主要是遊戲,但也包括與科學數據分析相關的 GPU 計算)時,我的筆記型電腦會過熱並最終由於快速達到高溫(三分鐘左右超過 90°C)而關閉。我有兩個 GPU:整個系統預設使用的整合 Intel 卡,以及僅在需要更多「功率」時才使用的 NVIDIA 獨立 GPU(透過主要的)。我的獨立 GPU 工作到了極限,但不會過熱。只有在使用 NVIDIA GPU 時才會發生。因此,我花了幾週的時間來學習如何對我的卡進行降頻。

我設法在 nvidia-settings 中啟用降頻/超頻酷比特。然而,我主要面臨三個問題:(i)我能夠設定的最小偏移是-200 MHz,這還不夠。 (ii) 超頻在 nvidia-settings powermizer 面板中立即生效,但僅在 P3(具有最高 MHz 值)中生效,而降頻則不會。最後,(iii) 我有 4 個 GPUPerfMode(0 到 3),其中三個具有相同的最小值和最大值(請參見此處):

  • 0:139-607
  • 1:139-1911
  • 2:139-1911
  • 3:139-1911

因此,為了解決過熱問題,我需要對卡片進行降頻或將 GPUPerfModes 更改為更實際的值,也就是說,堅持令人滿意且不會導致極端溫度的性能水平。為什麼會出現上述問題(i、ii 和 iii)?我的設定檔有問題嗎?設定?有任何想法嗎?

完整的 nvidia 錯誤報告:nvidia-bug-report.log.gz(280.2 KB)

眼鏡:

  • 戴爾 Inspiron 靈越 5480(擎天柱)
  • 作業系統:Arch Linux x86_64
  • 內核:5.7.12-arch1-1
  • 德文:GNOME 3.36.4
  • CPU:Intel i7-8565U (8) @ 4.600 GHz
  • GPU:NVIDIA GeForce MX150(驅動nvidia 450.57-6,首先註意到驅動版本問題 440.82-3
  • GPU:英特爾超高畫質顯示卡 620

答案1

Linux 中 NVIDIA 卡的電源管理非常糟糕,因此最好的選擇可能是將 GPU 限制在最低效能等級。

有兩種方法可以實現它,要么是一個 X.org 配置文件,您必須為其添加此配置文件(您可能需要重新啟動筆記型電腦以查看它是否有效):

    Option          "Coolbits" "28"
    Option          "RegistryDwords" "PowerMizerEnable=0x1; PerfLevelSrc=0x2222; PowerMizerLevel=0x3; PowerMizerDefault=0x3; PowerMizerDefaultAC=0x3"

如果它不起作用創建/etc/modprobe.d/nvidia.conf

options nvidia NVreg_RegistryDwords="OverrideMaxPerf=0x1"

並重新啟動(RegistryDwords不再需要 X.org 選項)。

你的表現會很糟糕,但熱量應該是一流的。以後請在這裡詢問 NVIDIA Linux 相關問題:https://forums.developer.nvidia.com/c/gpu-unix-graphics/linux/148

相關內容