GPU-Überhitzung: Passen Sie die Nvidia GPUPerfModes oder das Heruntertakten an: Keines davon kann bearbeitet werden

GPU-Überhitzung: Passen Sie die Nvidia GPUPerfModes oder das Heruntertakten an: Keines davon kann bearbeitet werden

Bei der Ausführung intensiver Aufgaben (meistens Gaming, aber auch GPU-Berechnungen im Zusammenhang mit wissenschaftlichen Datenanalysen) überhitzt mein Laptop und schaltet sich schließlich ab, da er schnell hohe Temperaturen erreicht (über 90 °C in etwa drei Minuten). Ich habe zwei GPUs: eine integrierte Intel-Karte, die standardmäßig im gesamten System verwendet wird, und eine diskrete NVIDIA-GPU, die nur verwendet wird, wenn mehr „Leistung“ benötigt wird (durchPRIME). Meine diskrete GPU arbeitet an ihren Grenzen, überhitzt aber nicht. Das passiert nur, wenn ich eine NVIDIA-GPU verwende. Ich habe also mehrere Wochen lang versucht, herauszufinden, wie ich meine Karte untertakten kann.

Ich habe es geschafft, Underclock/Overclock in den Nvidia-Einstellungen zu aktivieren mitcoolbits. Allerdings habe ich hauptsächlich mit drei Problemen zu kämpfen: (i) Der minimale Offset, den ich einstellen kann, beträgt -200 MHz, was nicht ausreicht. (ii) Das Übertakten wird im Powermizer-Panel der Nvidia-Einstellungen sofort wirksam, aber nur im P3 (das die höchsten MHz-Werte hat), und das Untertakten nicht. Schließlich (iii) habe ich 4 GPUPerfModes (0 bis 3), von denen drei die gleichen Mindest- und Höchstwerte haben (siehe hier):

  • 0: 139-607
  • 1: 139-1911
  • 2: 139-1911
  • 3: 139-1911

Um die Überhitzung zu vermeiden, muss ich meine Karte untertakten oder GPUPerfModes auf realistischere Werte ändern und, sagen wir mal, auf einem Leistungsniveau bleiben, das zufriedenstellend ist und nicht zu extremen Temperaturen führt. Warum treten die oben genannten Probleme (i, ii und iii) auf? Stimmt etwas mit meinen Konfigurationsdateien nicht? Einstellungen? Irgendwelche Ideen?

Vollständiger Nvidia-Fehlerbericht:nvidia-bug-report.log.gz(280,2 KB)

Spezifikationen:

  • Dell Inspiron 5480 (Optimus)
  • Betriebssystem: Arch Linux x86_64
  • Kernel: 5.7.12-arch1-1
  • DE: GNOME 3.36.4
  • CPU: Intel i7-8565U (8) @ 4.600 GHz
  • GPU: NVIDIA GeForce MX150 (Treiber nvidia 450.57-6, das Problem ist mir erstmals bei der Treiberversion aufgefallen  440.82-3)
  • GPU: Intel UHD Graphics 620

Antwort1

Die Energieverwaltung für NVIDIA-Karten in Linux ist notorisch schlecht, Ihre beste Option könnte also darin bestehen, Ihre GPU auf die niedrigste Leistungsstufe zu beschränken.

Dies kann auf zwei Arten erreicht werden: Entweder über eine X.org-Konfigurationsdatei, in der Sie Folgendes hinzufügen müssen (starten Sie ggf. Ihren Laptop neu, um zu prüfen, ob es funktioniert):

    Option          "Coolbits" "28"
    Option          "RegistryDwords" "PowerMizerEnable=0x1; PerfLevelSrc=0x2222; PowerMizerLevel=0x3; PowerMizerDefault=0x3; PowerMizerDefaultAC=0x3"

falls es nicht funktioniert, erstellen Sie /etc/modprobe.d/nvidia.conf

options nvidia NVreg_RegistryDwords="OverrideMaxPerf=0x1"

und neu starten ( RegistryDwordsOption für X.org ist nicht mehr erforderlich).

Ihre Leistung wird schrecklich sein, aber die Wärmeentwicklung sollte hervorragend sein. Stellen Sie in Zukunft bitte hier Fragen zu NVIDIA Linux:https://forums.developer.nvidia.com/c/gpu-unix-graphics/linux/148

verwandte Informationen