Я пытаюсь настроить кластер из 8 компьютеров плюс главный файловый сервер. В идеале я хотел бы настроить это в среде pxe-boot, квази-бездисковой/квази-без состояния (т. е. единственным локальным хранилищем является /var
, где будут храниться такие вещи, как конфигурация Torque). Каждый из 8 вычислительных узлов имеет 4 NVIDIA Tesla K40m, но корневой файловый сервер не имеет GPU.
В идеале я хотел бы иметь возможность создать полную установку на файловом сервере (на /node
), а затем PXE-загрузить ее на вычислительные узлы, но я не нашел способа установить драйверы NVIDIA без графического процессора NVIDIA на борту. Я нашелодин вопрос на форумах NVIDIAо том, как кто-то безуспешно пытался это сделать...
В качестве альтернативы я мог бы установить драйверы NVIDIA на один из вычислительных узлов (на одном из них в настоящее время на локальных дисках установлена ОС CentOS), чтобы (например) /usr/local/nvidia
отслеживать, какие файлы он создает, и создать tar-архив с ними, чтобы скопировать их на установку файлового сервера.
Наконец, я мог бы просто поддерживать восемь отдельных инсталляций, но мне это не нравится с точки зрения долгосрочного обслуживания (каждый вычислительный узел будет выполнять задачи Torque, поэтому я бы хотел, чтобы узлы выглядели более или менее идентично).
Подводя итог, я прошу следующее:
- Могу ли я установить драйверы NVIDIA без установленного графического процессора NVIDIA?
- Есть ли другой способ, которым мне следует поступить в этом случае?
Для справки: мы используем CentOS 7.
[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
решение1
Используйте RPM-пакеты, как и все остальное.
На данный момент лучше всего построеноПакеты драйверов NVIDIAвзяты из Negativo17.