這很愚蠢,但在我的情況下,我實際上並不知道我的伺服器上的 nVIDIA Grid K2 GPU 的數量(我無法親自去驗證)。
nvidia-smi 的輸出是:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 367.64 Driver Version: 367.64 |
|-------------------------------+----------------------+----------------------+
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC |
| Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. |
|===============================+======================+======================|
| 0 GRID K2 On | 0000:86:00.0 Off | Off |
| N/A 41C P8 29W / 117W | 10MiB / 4095MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 1 GRID K2 On | 0000:87:00.0 Off | Off |
| N/A 33C P8 28W / 117W | 8MiB / 4095MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
| 2 GRID K2 On | 0000:8B:00.0 Off | Off |
| N/A 34C P8 28W / 117W | 8MiB / 4095MiB | 0% Default |
+-------------------------------+----------------------+----------------------+
+-----------------------------------------------------------------------------+
| Processes: GPU Memory |
| GPU PID Type Process name Usage |
|=============================================================================|
| No running processes found |
+-----------------------------------------------------------------------------+
nvidia-smi -L 給出:
GPU 0: GRID K2 (UUID: GPU-f38f91db-d219-6dae-3f2c-ccce0dee93b5)
GPU 1: GRID K2 (UUID: GPU-a165f882-655e-31c0-b6f0-46748129ff17)
GPU 2: GRID K2 (UUID: GPU-44daaa30-3e5b-558c-2775-1e9802be7e91)
主機是20核心、2路Intel機器。
現在,我不明白為什麼它顯示3 個GPU,因為1 個Grid K2 實際上有2 個GPU,所以nvidia-smi 實際上應該顯示偶數個Grid K2 GPU(在我的例子中是2 個或4 個) 。
答案1
從你的統計數據來看,看起來像是 3,但你可以進行更詳細的檢查。
如果您的系統執行的是 Windows Server,請從 cmd 提示字元使用:
wmic path win32_VideoController get AdapterRAM, Caption, DriverVersion
如果您使用 Linux:
lspci | grep -i --color 'vga\|3d\|2d'
或者
lshw -short | grep -i --color display
nvclock
命令還應該顯示 GPU 上的時鐘資訊。
這些將列出有關視訊適配器的有用資訊。
答案2
嘗試nvidia-smi -L
(來自 Linux 系統上的 man nvidia-smi 輸出:)
-L, --list-gpus
列出系統中的每個 NVIDIA GPU 及其 UUID。
編輯: 重新閱讀原來的問題,我發現OP已經嘗試過這個解決方案,但這不是他們想要的。哦。