Instalação do driver NVIDIA GRID:https://docs.nvidia.com/grid/latest/grid-vgpu-user-guide/index.html#installing-vgpu-drivers-linux
Eu trabalho com um ambiente onde temos vários hosts com placas Tesla, cada um servindo fatias de vGPU para VMs clientes, mas com um pequeno número de versões diferentes do driver NVIDIA GRID. Instalamos o driver NVIDIA GRID automaticamente, mas quero passar de "tamanho único" (onde o driver majoritário é selecionado para instalação e as diferenças são corrigidas manualmente) para uma solução totalmente automatizada.
Não consigo encontrar na documentação da NVIDIA como consultar o computador host para determinar qual deveria ser essa versão. Parece que deveria ser por meio de ferramentas lspci
, dmesg
ou nvidia-smi
. Mas:
# lspci|grep VGA
02:00.0 VGA compatible controller: NVIDIA Corporation GV100GL [Tesla V100 PCIe 16GB] (rev a1)
Nenhuma pista aí. dmesg
apenas informa uma versão quando o módulo carrega com sucesso, ou seja, a versão corresponde; e nvidia-smi
nos diz lánão sãoquaisquer cartas até que a versão corresponda.
Há alguma informação fornecida ao cliente ou é uma causa perdida? (ou seja, diga aos mantenedores do host para usarem uma única versão consistente)