Установка драйверов NVIDIA для бездисковой среды

Установка драйверов NVIDIA для бездисковой среды

Я пытаюсь настроить кластер из 8 компьютеров плюс главный файловый сервер. В идеале я хотел бы настроить это в среде pxe-boot, квази-бездисковой/квази-без состояния (т. е. единственным локальным хранилищем является /var, где будут храниться такие вещи, как конфигурация Torque). Каждый из 8 вычислительных узлов имеет 4 NVIDIA Tesla K40m, но корневой файловый сервер не имеет GPU.

В идеале я хотел бы иметь возможность создать полную установку на файловом сервере (на /node), а затем PXE-загрузить ее на вычислительные узлы, но я не нашел способа установить драйверы NVIDIA без графического процессора NVIDIA на борту. Я нашелодин вопрос на форумах NVIDIAо том, как кто-то безуспешно пытался это сделать...

В качестве альтернативы я мог бы установить драйверы NVIDIA на один из вычислительных узлов (на одном из них в настоящее время на локальных дисках установлена ​​ОС CentOS), чтобы (например) /usr/local/nvidiaотслеживать, какие файлы он создает, и создать tar-архив с ними, чтобы скопировать их на установку файлового сервера.

Наконец, я мог бы просто поддерживать восемь отдельных инсталляций, но мне это не нравится с точки зрения долгосрочного обслуживания (каждый вычислительный узел будет выполнять задачи Torque, поэтому я бы хотел, чтобы узлы выглядели более или менее идентично).

Подводя итог, я прошу следующее:

  1. Могу ли я установить драйверы NVIDIA без установленного графического процессора NVIDIA?
  2. Есть ли другой способ, которым мне следует поступить в этом случае?

Для справки: мы используем CentOS 7.

[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

решение1

Используйте RPM-пакеты, как и все остальное.

На данный момент лучше всего построеноПакеты драйверов NVIDIAвзяты из Negativo17.

Связанный контент