Eu tenho duas GTX 1080ti em uma caixa Ubuntu 18.04, ambas edição do Founder. Eu os uso principalmente para treinar redes neurais.
Agora, basicamente tenho dois problemas:
Definir os coolbits (mesmo com --enable-all-gpus) permite definir a velocidade do ventilador e os relógiosapenas para a GPU que está conectada ao monitor
Eu gostaria de não definir a velocidade do ventilador estaticamente: em vez disso, gostaria de definir um perfil dinâmico,% velocidade do ventilador versus temperatura. Lembre-se de que quando no modo automático, sob carga, um 1080ti atinge regularmente 89-90C, não importa o afogamento e o fato de o case ser espaçoso. (o outro 1080ti permanece mais frio.. Acho que nem todos os GPUs são criados iguais) .
Informações sobre minha configuração:
inxi -b
System: Host: nimrod Kernel: 4.15.0-46-generic x86_64 bits: 64
Desktop: Xfce 4.12.3 Distro: Ubuntu 18.04.2 LTS
Machine: Device: desktop Mobo: FUJITSU model: D3128-B2 v: S26361-D3128-B2 serial: N/A
UEFI: FUJITSU // American Megatrends v: V4.6.5.4 R1.8.0 for D3128-B2x date: 06/28/2018
CPU: 10 core Intel Xeon E5-2680 v2 (-MT-MCP-) speed/max: 2269/3600 MHz
Graphics: Card-1: Advanced Micro Devices [AMD/ATI] Park [Mobility Radeon HD 5430]
Card-2: NVIDIA GP102 [GeForce GTX 1080 Ti]
Card-3: NVIDIA GP102 [GeForce GTX 1080 Ti]
Display Server: x11 (X.Org 1.19.6 )
drivers: modesetting,nvidia,ati,radeon,nouveau (unloaded: fbdev,vesa)
Resolution: [email protected]
OpenGL: renderer: GeForce GTX 1080 Ti/PCIe/SSE2
version: 4.6.0 NVIDIA 415.27
Network: Card: Intel 82579LM Gigabit Network Connection (Lewisville)
driver: e1000e
Drives: HDD Total Size: 2262.5GB (9.5% used)
Info: Processes: 413 Uptime: 10 min Memory: 3677.2/96560.4MB
Client: Shell (bash) inxi: 2.3.56
Nvidia-smi:
Mon Mar 25 04:19:30 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 415.27 Driver Version: 415.27 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... Off | 00000000:03:00.0 Off | N/A |
| 23% 39C P8 10W / 250W | 2MiB / 11178MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 108... Off | 00000000:04:00.0 On | N/A |
| 31% 57C P0 69W / 250W | 204MiB / 11176MiB | 2% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 1 1465 G /usr/lib/xorg/Xorg 201MiB |
+-----------------------------------------------------------------------------+
E finalmente meu xorg.conf
# nvidia-xconfig: X configuration file generated by nvidia-xconfig
# nvidia-xconfig: version 415.27
Section "ServerLayout"
Identifier "Layout0"
Screen 0 "Screen0"
Screen 1 "Screen1" RightOf "Screen0"
InputDevice "Keyboard0" "CoreKeyboard"
InputDevice "Mouse0" "CorePointer"
EndSection
Section "Files"
EndSection
Section "InputDevice"
# generated from default
Identifier "Mouse0"
Driver "mouse"
Option "Protocol" "auto"
Option "Device" "/dev/psaux"
Option "Emulate3Buttons" "no"
Option "ZAxisMapping" "4 5"
EndSection
Section "InputDevice"
# generated from default
Identifier "Keyboard0"
Driver "kbd"
EndSection
Section "Monitor"
Identifier "Monitor0"
VendorName "Unknown"
ModelName "Unknown"
HorizSync 28.0 - 33.0
VertRefresh 43.0 - 72.0
Option "DPMS"
EndSection
Section "Monitor"
Identifier "Monitor1"
VendorName "Unknown"
ModelName "Unknown"
HorizSync 28.0 - 33.0
VertRefresh 43.0 - 72.0
Option "DPMS"
EndSection
Section "Device"
Identifier "Device0"
Driver "nvidia"
VendorName "NVIDIA Corporation"
BoardName "GeForce GTX 1080 Ti"
BusID "PCI:3:0:0"
EndSection
Section "Device"
Identifier "Device1"
Driver "nvidia"
VendorName "NVIDIA Corporation"
BoardName "GeForce GTX 1080 Ti"
BusID "PCI:4:0:0"
EndSection
Section "Screen"
Identifier "Screen0"
Device "Device0"
Monitor "Monitor0"
DefaultDepth 24
Option "AllowEmptyInitialConfiguration" "True"
Option "Coolbits" "31"
SubSection "Display"
Depth 24
EndSubSection
EndSection
Section "Screen"
Identifier "Screen1"
Device "Device1"
Monitor "Monitor1"
DefaultDepth 24
Option "AllowEmptyInitialConfiguration" "True"
Option "Coolbits" "31"
SubSection "Display"
Depth 24
EndSubSection
EndSection
Observe que os coolbits estão definidos para ambos.
Pode me ajudar?
Obrigado! :)
Responder1
Experimentei exatamente a mesma coisa na semana passada. A culpa é do motorista. Experimente a versão 390 ou 430, são as duas versões que confirmei que funcionam corretamente no arch, com dois 1080ti.
É realmente difícil identificar o problema. A princípio pensei que a culpa era da minha placa-mãe que não suporta SLI, então usei outra placa-mãe e ativei o SLI, então posso definir a velocidade da ventoinha para ambas as GPUs. Porém, ao usar SLI, as duas placas gráficas usavam as mesmas memórias em duas GPUs. Isso é inaceitável porque o SLI diminui o tamanho do lote. Então eu desativo o SLI e não consigo definir a velocidade do ventilador para ambas as placas novamente. Então tentei mudar meu driver nvidia, que funcionou corretamente. Droga nvidia, quebrei a base LGA da primeira placa-mãe quando troquei outra placa-mãe e queimei um i5-9400f por causa da base quebrada. Eu sei que é por meu descuido, mas eu não teria que sofrer se não fosse pelo bug dos drivers da nvidia.(só algumas reclamações bobas)