
Estoy intentando configurar un grupo de 8 computadoras más un servidor de archivos principal. Idealmente, me gustaría configurar esto en un entorno pxe-boot, casi sin disco/cuasi sin estado (es decir, el único almacenamiento local es /var
, donde irán cosas como la configuración del par). Cada uno de los 8 nodos de cómputo tiene 4 NVIDIA Tesla K40m, pero el servidor de archivos raíz no tiene GPU.
Idealmente, me gustaría poder crear la instalación completa en el servidor de archivos (en /node
) y luego iniciarlo mediante PXE en los nodos de cómputo, pero no he encontrado una manera de instalar los controladores NVIDIA sin una GPU NVIDIA en junta. encontréuna pregunta en los foros de NVIDIAacerca de cómo alguien intentó esto sin éxito...
Alternativamente, podría instalar los controladores NVIDIA en uno de los nodos de computación (uno de ellos actualmente ejecuta CentOS en sus discos locales) para (por ejemplo) /usr/local/nvidia
realizar un seguimiento de los archivos que crea y crear un tarball para copiarlos en el servidor de archivos. instalación.
Por último, podría mantener solo ocho instalaciones separadas, pero no me gusta esto desde una perspectiva de mantenimiento a largo plazo (cada nodo de cómputo ejecutará trabajos de torsión, por lo que me gustaría que los nodos se vean más o menos idénticos). .
En resumen lo que pido es esto:
- ¿Puedo instalar los controladores NVIDIA sin una GPU NVIDIA integrada?
- ¿Hay alguna otra forma en la que debería hacer esto?
Como referencia, estamos ejecutando CentOS 7.
[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
Respuesta1
Utilice paquetes RPM, como todo lo demás.
Actualmente el mejor construido.Paquetes de controladores NVIDIAson de Negativo17.