我的 Nvidia 驅動程式出現這個問題已有幾個月了。這是我通常會做的事情:
我停止 gdm3 ( sudo service gdm3 stop
),安裝驅動程序sudo ./NVIDIA-Linux-x86_64-418.74.run --no-x-check
,然後按照說明進行操作,然後使用文件將 noveau 列入黑名單blacklist-nouveau.conf
- 它包含blacklist nouveau
,
options nouveau modeset=0
然後安裝 cuda、cudnn 等...一切正常,包括nvidia-smi
,我可以在gpu 上運行代碼(tensorflow 中的一些NN 模型) )。幾次重新啟動後,我的驅動程式崩潰了。我啟動時進入解析度為 800x600 的登入畫面,但沒有更改它的選項。nvidia-smi
報告它無法連接到驅動程式。然後我重新安裝驅動程序,然後它工作了一段時間,但重新啟動幾次後又崩潰了。
有幾次我完全重新安裝了所有東西,包括 Cuda 等,但行為沒有改變。知道會出什麼問題嗎?