Перегрев графического процессора: настройка Nvidia GPUPerfModes или понижение тактовой частоты: не удалось изменить ни один из них

Перегрев графического процессора: настройка Nvidia GPUPerfModes или понижение тактовой частоты: не удалось изменить ни один из них

При выполнении интенсивных задач (в основном игр, но также вычислений на GPU, связанных с научным анализом данных) мой ноутбук перегревается и в конечном итоге выключается из-за быстрого достижения высоких температур (более 90 °C за три минуты или около того). У меня два GPU: интегрированная карта Intel, используемая по умолчанию во всей системе, и дискретный GPU NVIDIA, который используется только тогда, когда требуется больше «мощности» (черезОСНОВНОЙ). Мой дискретный графический процессор работает на пределе своих возможностей, но не перегревается. Это происходит только при использовании графического процессора NVIDIA. Поэтому я несколько недель пытался узнать, как понизить частоту своей карты.

Мне удалось включить разгон/снижение тактовой частоты в настройках nvidia с помощьюкрутые штуки. Однако, я в основном сталкиваюсь с тремя проблемами: (i) минимальное смещение, которое я могу установить, составляет -200 МГц, что недостаточно. (ii) Разгон вступает в силу немедленно в панели nvidia-settings powermizer, но только в P3 (где самые высокие значения МГц), а разгон ниже — нет. Наконец, (iii) у меня есть 4 GPUPerfModes (от 0 до 3), три из которых имеют одинаковые минимальные и максимальные значения (см. здесь):

  • 0: 139-607
  • 1: 139-1911
  • 2: 139-1911
  • 3: 139-1911

Итак, чтобы справиться с перегревом, мне нужно понизить частоту моей карты или изменить GPUPerfModes на более реалистичные значения и, скажем, придерживаться уровня производительности, который является удовлетворительным и не приводит к экстремальным температурам. Почему происходят проблемы, описанные выше (i, ii и iii)? Что-то не так с моими файлами конфигурации? Настройки? Есть идеи?

Полный отчет об ошибке nvidia:nvidia-bug-report.log.gz(280,2 КБ)

Характеристики:

  • Dell Inspiron 5480 (Оптимус)
  • ОС: Arch Linux x86_64
  • Ядро: 5.7.12-arch1-1
  • DE: GNOME 3.36.4
  • Процессор: Intel i7-8565U (8) @ 4.600 ГГц
  • Видеокарта: NVIDIA GeForce MX150 (драйвер nvidia 450.57-6, впервые заметил проблему в версии драйвера  440.82-3)
  • Графический процессор: Intel UHD Graphics 620

решение1

Управление питанием видеокарт NVIDIA в Linux, как известно, неэффективно, поэтому лучшим вариантом может стать ограничение производительности графического процессора до минимального уровня.

Есть два способа сделать это: либо с помощью файла конфигурации X.org, в который нужно добавить следующее (возможно, вам придется перезагрузить ноутбук, чтобы проверить, работает ли это):

    Option          "Coolbits" "28"
    Option          "RegistryDwords" "PowerMizerEnable=0x1; PerfLevelSrc=0x2222; PowerMizerLevel=0x3; PowerMizerDefault=0x3; PowerMizerDefaultAC=0x3"

в случае если не сработает создайте /etc/modprobe.d/nvidia.conf

options nvidia NVreg_RegistryDwords="OverrideMaxPerf=0x1"

и перезагрузите компьютер ( RegistryDwordsопция для X.org больше не понадобится).

Ваша производительность будет ужасной, но термические характеристики должны быть великолепными. В будущем задавайте вопросы, связанные с NVIDIA Linux, здесь:https://forums.developer.nvidia.com/c/gpu-unix-graphics/linux/148

Связанный контент