Estou com esse problema com o driver da Nvidia há alguns meses. Aqui está o que costumo fazer:
Eu paro o gdm3 ( sudo service gdm3 stop
), instalo o driver com sudo ./NVIDIA-Linux-x86_64-418.74.run --no-x-check
, depois sigo as instruções, depois coloco o noveau na lista negra usando blacklist-nouveau.conf
o arquivo - ele contém blacklist nouveau
e
options nouveau modeset=0
então instalo cuda, cudnn etc ... Tudo funciona corretamente, inclusive nvidia-smi
, posso executar o código no gpu (alguns modelos NN no tensorflow ). Depois de algumas reinicializações, meu driver quebra. Eu inicializo na tela de login definida na resolução 800x600 sem opção de alterá-la. nvidia-smi
relata que não pode se conectar ao driver. Então eu reinstalo o driver e ele funciona por um tempo, mas depois de algumas reinicializações ele quebra novamente.
Poucas vezes reinstalei tudo completamente, inclusive Cuda etc., porém nenhuma mudança de comportamento. Alguma ideia do que pode estar errado?