Instalación del controlador NVIDIA GRID:https://docs.nvidia.com/grid/latest/grid-vgpu-user-guide/index.html#installing-vgpu-drivers-linux
Trabajo en un entorno en el que tenemos varios hosts con tarjetas Tesla, cada uno de los cuales sirve porciones de vGPU a las máquinas virtuales del cliente, pero con una pequeña cantidad de versiones diferentes del controlador NVIDIA GRID. Instalamos el controlador NVIDIA GRID automáticamente, pero quiero pasar de "talla única" (donde se selecciona el controlador mayoritario para la instalación y las diferencias se solucionan manualmente) a una solución totalmente automatizada.
No puedo encontrar en la documentación de NVIDIA cómo consultar la computadora host para determinar cuál debería ser esa versión. Parece que debería ser a través de herramientas lspci
, dmesg
o nvidia-smi
. Pero:
# lspci|grep VGA
02:00.0 VGA compatible controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
No hay idea ahí. dmesg
sólo le indica una versión cuando el módulo se carga exitosamente, es decir, la versión coincide; y nvidia-smi
ahí nos diceno lo soncualquier tarjeta hasta que la versión coincida.
¿Se proporciona alguna información al cliente o es una causa perdida? (es decir, indique a los encargados del mantenimiento del host que utilicen una única versión coherente)