Tengo este problema con el controlador de Nvidia desde hace unos meses. Esto es lo que suelo hacer normalmente:
Detengo gdm3 ( sudo service gdm3 stop
), instalo el controlador sudo ./NVIDIA-Linux-x86_64-418.74.run --no-x-check
, luego sigo las instrucciones, luego incluyo a noveau en la lista negra usando blacklist-nouveau.conf
el archivo; contiene blacklist nouveau
y
options nouveau modeset=0
luego instalo cuda, cudnn, etc. Todo funciona correctamente, incluido nvidia-smi
, puedo ejecutar código en gpu (algunos modelos NN en tensorflow ). Después de algunos reinicios, mi controlador falla. Arranco en la pantalla de inicio de sesión configurada en una resolución de 800x600 sin opción a cambiarla. nvidia-smi
informa que no puede conectarse al controlador. Luego reinstalo el controlador y luego funciona por un tiempo, pero después de algunos reinicios vuelve a fallar.
Pocas veces reinstalé todo por completo, incluido Cuda, etc., sin embargo, no hubo cambios en el comportamiento. ¿Alguna idea de qué puede estar mal?