![為無磁碟環境安裝 NVIDIA 驅動程式](https://rvso.com/image/697030/%E7%82%BA%E7%84%A1%E7%A3%81%E7%A2%9F%E7%92%B0%E5%A2%83%E5%AE%89%E8%A3%9D%20NVIDIA%20%E9%A9%85%E5%8B%95%E7%A8%8B%E5%BC%8F.png)
我正在嘗試建立一個由 8 台電腦和一個主文件伺服器組成的叢集。理想情況下,我想將其設置在 pxe-boot、準無盤/準無狀態環境中(即唯一的本地存儲是/var
,扭矩配置等內容將存放在其中)。 8 個運算節點中的每一個都有 4 個 NVIDIA Tesla K40m,但根檔案伺服器沒有 GPU。
理想情況下,我希望能夠在檔案伺服器(位於/node
)上建立完整的安裝,然後透過 PXE 引導到運算節點,但是,我還沒有找到在沒有 NVIDIA GPU 的情況下安裝 NVIDIA 驅動程式的方法木板。我發現NVIDIA 論壇上的一個問題關於有人如何嘗試失敗...
或者,我可以將 NVIDIA 驅動程式安裝到其中一個計算節點(其中一個目前在其本機磁碟上運行 CentOS),以(例如)/usr/local/nvidia
追蹤它建立的文件,並建立該文件的 tarball 以複製到文件伺服器安裝。
最後,我可以只維護八個獨立的安裝,但是,從長期維護的角度來看,我不喜歡這樣(每個計算節點都將運行扭矩作業,因此我希望節點看起來或多或少相同) 。
總而言之,我要求的是:
- 我可以在沒有板載 NVIDIA GPU 的情況下安裝 NVIDIA 驅動程式嗎?
- 我還應該採取其他方法嗎?
作為參考,我們運行的是 CentOS 7。
[root@compute-3 /]# uname -a
Linux compute-3 3.10.0-514.2.2.el7.x86_64 #1 SMP Tue Dec 6 23:06:41 UTC 2016 x86_64 x86_64 x86_64 GNU/Linux
答案1
像其他東西一樣使用 RPM 套件。
目前建造最好的NVIDIA 驅動程式套件來自 Negativo17。