
Tengo dos GTX 1080ti en una caja Ubuntu 18.04, ambas edición Founder. Los uso principalmente para entrenar redes neuronales.
Ahora, básicamente tengo dos problemas:
Configurar los coolbits (incluso con --enable-all-gpus) me permite configurar la velocidad del ventilador y los relojessolo para la GPU que está conectada al monitor
Me gustaría no configurar la velocidad del ventilador de forma estática: más bien, me gustaría establecer un perfil dinámico, % de velocidad del ventilador frente a temperatura. Tenga en cuenta que cuando está en modo automático, bajo carga, un 1080ti alcanza regularmente los 89-90 °C, sin importar la aceleración y el hecho de que la carcasa sea espaciosa... (el otro 1080ti se mantiene más frío... Creo que no todos los gpus son iguales) .
Información sobre mi configuración:
inxi -b
System: Host: nimrod Kernel: 4.15.0-46-generic x86_64 bits: 64
Desktop: Xfce 4.12.3 Distro: Ubuntu 18.04.2 LTS
Machine: Device: desktop Mobo: FUJITSU model: D3128-B2 v: S26361-D3128-B2 serial: N/A
UEFI: FUJITSU // American Megatrends v: V4.6.5.4 R1.8.0 for D3128-B2x date: 06/28/2018
CPU: 10 core Intel Xeon E5-2680 v2 (-MT-MCP-) speed/max: 2269/3600 MHz
Graphics: Card-1: Advanced Micro Devices [AMD/ATI] Park [Mobility Radeon HD 5430]
Card-2: NVIDIA GP102 [GeForce GTX 1080 Ti]
Card-3: NVIDIA GP102 [GeForce GTX 1080 Ti]
Display Server: x11 (X.Org 1.19.6 )
drivers: modesetting,nvidia,ati,radeon,nouveau (unloaded: fbdev,vesa)
Resolution: [email protected]
OpenGL: renderer: GeForce GTX 1080 Ti/PCIe/SSE2
version: 4.6.0 NVIDIA 415.27
Network: Card: Intel 82579LM Gigabit Network Connection (Lewisville)
driver: e1000e
Drives: HDD Total Size: 2262.5GB (9.5% used)
Info: Processes: 413 Uptime: 10 min Memory: 3677.2/96560.4MB
Client: Shell (bash) inxi: 2.3.56
Nvidia-smi:
Mon Mar 25 04:19:30 2019
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 415.27 Driver Version: 415.27 CUDA Version: 10.0 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GeForce GTX 108... Off | 00000000:03:00.0 Off | N/A |
| 23% 39C P8 10W / 250W | 2MiB / 11178MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 GeForce GTX 108... Off | 00000000:04:00.0 On | N/A |
| 31% 57C P0 69W / 250W | 204MiB / 11176MiB | 2% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| 1 1465 G /usr/lib/xorg/Xorg 201MiB |
+-----------------------------------------------------------------------------+
Y finalmente mi xorg.conf
# nvidia-xconfig: X configuration file generated by nvidia-xconfig
# nvidia-xconfig: version 415.27
Section "ServerLayout"
Identifier "Layout0"
Screen 0 "Screen0"
Screen 1 "Screen1" RightOf "Screen0"
InputDevice "Keyboard0" "CoreKeyboard"
InputDevice "Mouse0" "CorePointer"
EndSection
Section "Files"
EndSection
Section "InputDevice"
# generated from default
Identifier "Mouse0"
Driver "mouse"
Option "Protocol" "auto"
Option "Device" "/dev/psaux"
Option "Emulate3Buttons" "no"
Option "ZAxisMapping" "4 5"
EndSection
Section "InputDevice"
# generated from default
Identifier "Keyboard0"
Driver "kbd"
EndSection
Section "Monitor"
Identifier "Monitor0"
VendorName "Unknown"
ModelName "Unknown"
HorizSync 28.0 - 33.0
VertRefresh 43.0 - 72.0
Option "DPMS"
EndSection
Section "Monitor"
Identifier "Monitor1"
VendorName "Unknown"
ModelName "Unknown"
HorizSync 28.0 - 33.0
VertRefresh 43.0 - 72.0
Option "DPMS"
EndSection
Section "Device"
Identifier "Device0"
Driver "nvidia"
VendorName "NVIDIA Corporation"
BoardName "GeForce GTX 1080 Ti"
BusID "PCI:3:0:0"
EndSection
Section "Device"
Identifier "Device1"
Driver "nvidia"
VendorName "NVIDIA Corporation"
BoardName "GeForce GTX 1080 Ti"
BusID "PCI:4:0:0"
EndSection
Section "Screen"
Identifier "Screen0"
Device "Device0"
Monitor "Monitor0"
DefaultDepth 24
Option "AllowEmptyInitialConfiguration" "True"
Option "Coolbits" "31"
SubSection "Display"
Depth 24
EndSubSection
EndSection
Section "Screen"
Identifier "Screen1"
Device "Device1"
Monitor "Monitor1"
DefaultDepth 24
Option "AllowEmptyInitialConfiguration" "True"
Option "Coolbits" "31"
SubSection "Display"
Depth 24
EndSubSection
EndSection
Tenga en cuenta que los coolbits están configurados para ambos.
¿Me puedes ayudar?
¡Gracias! :)
Respuesta1
He experimentado exactamente lo mismo la semana pasada. La culpa es del conductor. Pruebe la versión 390 o 430, son las dos versiones que confirmé que funcionan correctamente en arch, con dos 1080ti.
Es realmente difícil identificar el problema. Al principio pensé que era culpa de mi placa base que no soporta SLI, así que usé otra placa base y activé SLI, luego puedo configurar la velocidad del ventilador para ambas GPU. Sin embargo, al usar SLI, las dos tarjetas gráficas usaban las mismas memorias en dos GPU. Esto es inaceptable porque SLI reduce el tamaño del lote. Luego desactivo SLI y no puedo volver a configurar la velocidad del ventilador para ambas tarjetas. Entonces intenté cambiar mi controlador nvidia, que luego funciona correctamente. Maldita nvidia, rompí la base LGA en la primera placa base cuando cambié otra placa base y quemé un i5-9400f debido a la base rota. Sé que se debe a mi descuido, pero no tendría que sufrir si no fuera por el error de los controladores de nvidia (solo algunas quejas sin sentido).