Installieren von NVIDIA-Treibern für eine Umgebung ohne Datenträger

Installieren von NVIDIA-Treibern für eine Umgebung ohne Datenträger

Ich versuche, einen Cluster aus 8 Computern und einem Hauptdateiserver einzurichten. Idealerweise würde ich dies in einer PXE-Boot-Umgebung ohne Festplatten und ohne Status einrichten (d. h. der einzige lokale Speicher ist /var, wo Dinge wie die Torque-Konfiguration abgelegt werden). Jeder der 8 Rechenknoten verfügt über 4 NVIDIA Tesla K40m, aber der Root-Dateiserver hat keine GPU.

Im Idealfall würde ich gerne die komplette Installation auf dem Dateiserver (unter /node) erstellen und diese dann per PXE-Boot auf den Rechenknoten starten, aber ich habe keine Möglichkeit gefunden, die NVIDIA-Treiber ohne eine NVIDIA-GPU an Bord zu installieren. Ich fandeine Frage in den Foren von NVIDIAdarüber, wie jemand dies erfolglos versucht hat ...

Alternativ könnte ich die NVIDIA-Treiber auf einem der Rechenknoten installieren (auf einem läuft derzeit CentOS auf seinen lokalen Festplatten), um (beispielsweise) /usr/local/nvidiazu verfolgen, welche Dateien sie erstellen, und davon ein Tarball zu erstellen, um es in die Dateiserverinstallation zu kopieren.

Und schließlich könnte ich einfach acht separate Installationen verwalten, aber aus Sicht der langfristigen Wartung ist mir das nicht recht (auf jedem Rechenknoten werden Torque-Jobs ausgeführt, deshalb hätte ich gerne, dass die Knoten mehr oder weniger identisch aussehen).

Zusammengefasst ist meine Bitte folgendes:

  1. Kann ich die NVIDIA-Treiber installieren, ohne dass eine NVIDIA-GPU an Bord ist?
  2. Gibt es eine andere Möglichkeit, wie ich das angehen sollte?

Als Referenz: Wir verwenden CentOS 7.

[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

Antwort1

Verwenden Sie wie alles andere RPM-Pakete.

Im Moment die am besten gebauteNVIDIA-Treiberpaketesind von Negativo17.

verwandte Informationen