Installation des NVIDIA GRID-Treibers:https://docs.nvidia.com/grid/latest/grid-vgpu-user-guide/index.html#installing-vgpu-drivers-linux
Ich arbeite in einer Umgebung, in der wir mehrere Hosts mit Tesla-Karten haben, die jeweils vGPU-Slices an Client-VMs liefern, aber mit einer kleinen Anzahl unterschiedlicher Versionen des NVIDIA GRID-Treibers. Wir installieren den NVIDIA GRID-Treiber automatisch, aber ich möchte von einer „Einheitslösung“ (bei der der Mehrheitstreiber zur Installation ausgewählt wird und Unterschiede manuell behoben werden) zu einer vollautomatischen Lösung wechseln.
Ich kann in der NVIDIA-Dokumentation nicht finden, wie ich den Hostcomputer abfragen kann, um festzustellen, welche Version es sein sollte. Es scheint, als müsste dies über lspci
, dmesg
oder nvidia-smi
Tools erfolgen. Aber:
# lspci|grep VGA
02:00.0 VGA compatible controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
Keine Ahnung. dmesg
sagt Ihnen nur eine Version, wenn das Modul erfolgreich geladen wird, d. h. die Version stimmt überein; und nvidia-smi
sagt uns dortsind nichtbeliebige Karten, bis die Version übereinstimmt.
Werden dem Client Informationen übermittelt oder ist das ein hoffnungsloser Fall? (sagen Sie den Host-Betreuern beispielsweise, dass sie eine einzige konsistente Version verwenden sollen)