GPU 過熱: Nvidia GPUPerfModes を調整するか、クロックを下げる: いずれも編集できません

GPU 過熱: Nvidia GPUPerfModes を調整するか、クロックを下げる: いずれも編集できません

集中的なタスク(主にゲームですが、科学的なデータ分析に関連するGPU計算も)を実行すると、ラップトップが過熱し、最終的には高温(3分ほどで90°C以上)に達してシャットダウンします。私は2つのGPUを持っています。システム全体でデフォルトで使用される統合Intelカードと、より多くの「パワー」が必要な場合にのみ使用されるNVIDIAディスクリートGPUです(プライム)。私のディスクリート GPU は限界まで動作しますが、オーバーヒートしません。これは NVIDIA GPU を使用している場合にのみ発生します。そのため、私は数週間にわたって、カードをアンダークロックする方法を習得するのに苦労しました。

私はnvidia設定でアンダークロック/オーバークロックを有効にすることができましたクールビッツただし、主に 3 つの問題に直面しています。(i) 設定できる最小オフセットは -200 MHz ですが、これでは不十分です。(ii) オーバークロックは nvidia-settings powermizer パネルですぐに有効になりますが、P3 (MHz の最高値を持つ) のみで、アンダークロックは有効になりません。最後に、(iii) GPUPerfModes が 4 つ (0 から 3) あり、そのうち 3 つには同じ最小値と最大値があります (こちらを参照)。

  • 0: 139-607
  • 1: 139-1911
  • 2: 139-1911
  • 3: 139-1911

したがって、過熱に対処するには、カードをアンダークロックするか、GPUPerfModes をより現実的な値に変更して、極端な温度上昇を引き起こさない、満足できるパフォーマンス レベルを維持する必要があります。上記で報告された問題 (i、ii、iii) はなぜ発生するのでしょうか。構成ファイルや設定に問題があるのでしょうか。何かアイデアはありますか。

完全なNVIDIAバグレポート:nvidia バグレポート.log.gz(280.2 KB)

仕様:

  • Dell Inspiron 5480 (オプティマス)
  • OS: Linux x86_64 オペレーティングシステム:
  • カーネル: 5.7.12-arch1-1
  • DE: GNOME 3.36.4
  • CPU: Intel i7-8565U (8) @ 4.600GHz
  • GPU: NVIDIA GeForce MX150 (ドライバーnvidia 450.57-6、ドライバー バージョン で最初に問題に気付きました 440.82-3)
  • GPU: インテル UHD グラフィックス 620

答え1

Linux での NVIDIA カードの電源管理は非常に悪いので、GPU を最低のパフォーマンス レベルに制限することが最善の選択肢となる可能性があります。

これを実現するには 2 つの方法があります。X.org 構成ファイルにこれを追加する必要があります (動作するかどうかを確認するには、ラップトップを再起動することをお勧めします)。

    Option          "Coolbits" "28"
    Option          "RegistryDwords" "PowerMizerEnable=0x1; PerfLevelSrc=0x2222; PowerMizerLevel=0x3; PowerMizerDefault=0x3; PowerMizerDefaultAC=0x3"

動作しない場合は、/etc/modprobe.d/nvidia.confを作成してください。

options nvidia NVreg_RegistryDwords="OverrideMaxPerf=0x1"

再起動します(RegistryDwordsX.org のオプションは不要になります)。

パフォーマンスはひどいものになりますが、熱は素晴らしいはずです。今後は、NVIDIA Linux 関連の質問をこちらでお寄せください。https://forums.developer.nvidia.com/c/gpu-unix-graphics/linux/148

関連情報