為無磁碟環境安裝 NVIDIA 驅動程式

為無磁碟環境安裝 NVIDIA 驅動程式

我正在嘗試建立一個由 8 台電腦和一個主文件伺服器組成的叢集。理想情況下,我想將其設置在 pxe-boot、準無盤/準無狀態環境中(即唯一的本地存儲是/var,扭矩配置等內容將存放在其中)。 8 個運算節點中的每一個都有 4 個 NVIDIA Tesla K40m,但根檔案伺服器沒有 GPU。

理想情況下,我希望能夠在檔案伺服器(位於/node)上建立完整的安裝,然後透過 PXE 引導到運算節點,但是,我還沒有找到在沒有 NVIDIA GPU 的情況下安裝 NVIDIA 驅動程式的方法木板。我發現NVIDIA 論壇上的一個問題關於有人如何嘗試失敗...

或者,我可以將 NVIDIA 驅動程式安裝到其中一個計算節點(其中一個目前在其本機磁碟上運行 CentOS),以(例如)/usr/local/nvidia追蹤它建立的文件,並建立該文件的 tarball 以複製到文件伺服器安裝。

最後,我可以只維護八個獨立的安裝,但是,從長期維護的角度來看,我不喜歡這樣(每個計算節點都將運行扭矩作業,因此我希望節點看起來或多或少相同) 。

總而言之,我要求的是:

  1. 我可以在沒有板載 NVIDIA GPU 的情況下安裝 NVIDIA 驅動程式嗎?
  2. 我還應該採取其他方法嗎?

作為參考,我們運行的是 CentOS 7。

[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux

答案1

像其他東西一樣使用 RPM 套件。

目前建造最好的NVIDIA 驅動程式套件來自 Negativo17。

相關內容