Superaquecimento da GPU: Ajuste Nvidia GPUPerfModes ou downclock: não é possível editar nenhum deles

Superaquecimento da GPU: Ajuste Nvidia GPUPerfModes ou downclock: não é possível editar nenhum deles

Ao executar tarefas intensivas (principalmente jogos, mas também computação de GPU relacionada à análise de dados científicos), meu laptop superaquece e desliga devido ao rápido alcance de altas temperaturas (mais de 90 °C em cerca de três minutos). Eu tenho duas GPUs: uma placa Intel integrada usada por padrão em todo o sistema e uma GPU discreta NVIDIA que é usada apenas quando mais "potência" é necessária (através deMELHOR). Minha GPU discreta funciona até o limite, mas não superaquece. Ocorre apenas ao usar GPU NVIDIA. Então, lutei por várias semanas para aprender como fazer o underclock do meu cartão.

Consegui ativar underclock/overclock nas configurações da nvidia usandocoisas legais. No entanto, estou enfrentando principalmente três problemas: (i) o deslocamento mínimo que consigo definir é -200 MHz, o que não é suficiente. (ii) O overclocking entra em vigor imediatamente no painel powermizer com configurações da nvidia, mas apenas no P3 (que tem os valores mais altos de MHz) e o underclocking não. Finalmente, (iii) tenho 4 GPUPerfModes (0 a 3), três dos quais têm os mesmos valores mínimo e máximo (veja aqui):

  • 0: 139-607
  • 1: 139-1911
  • 2: 139-1911
  • 3: 139-1911

Portanto, para lidar com o superaquecimento, preciso fazer o underclock da minha placa ou alterar GPUPerfModes para valores mais realistas e, digamos, manter um nível de desempenho que seja satisfatório e não leve a temperaturas extremas. Por que os problemas relatados acima (i, ii e iii) estão acontecendo? Há algo errado com meus arquivos de configuração? Configurações? Alguma ideia?

Relatório de bug completo da nvidia:nvidia-bug-report.log.gz(280,2KB)

Especificações:

  • Dell Inspiron 5480 (Optimus)
  • SO: Arch Linux x86_64
  • Núcleo: 5.7.12-arch1-1
  • DE: GNOME 3.36.4
  • Processador: Intel i7-8565U (8) a 4.600 GHz
  • GPU: NVIDIA GeForce MX150 (driver nvidia 450.57-6, notei o problema pela primeira vez na versão do driver  440.82-3)
  • GPU: Gráficos Intel UHD 620

Responder1

O gerenciamento de energia para placas NVIDIA no Linux é notoriamente ruim, então sua melhor opção pode ser limitar sua GPU ao nível de desempenho mais baixo.

Existem duas maneiras de fazer isso, ou um arquivo de configuração X.org ao qual você deve adicionar isso (você pode reiniciar seu laptop para ver se funciona):

    Option          "Coolbits" "28"
    Option          "RegistryDwords" "PowerMizerEnable=0x1; PerfLevelSrc=0x2222; PowerMizerLevel=0x3; PowerMizerDefault=0x3; PowerMizerDefaultAC=0x3"

caso não funcione, crie /etc/modprobe.d/nvidia.conf

options nvidia NVreg_RegistryDwords="OverrideMaxPerf=0x1"

e reinicie ( RegistryDwordsa opção para X.org não será mais necessária).

Seu desempenho será horrível, mas as térmicas devem ser excelentes. No futuro, faça perguntas relacionadas ao NVIDIA Linux aqui:https://forums.developer.nvidia.com/c/gpu-unix-graphics/linux/148

informação relacionada