Estou treinando uma rede neural profunda em minha GPU GeForce 1080 e desligando sem aviso prévio. Estou monitorando a temperatura da GPU, mas ela não passa de 88, e aumentar o ventilador da GPU não ajuda. Também reduzir o limite de potência de 180W para 170W não ajuda.
Se a GPU estivesse superaquecendo, ambas as alterações deveriam ter algum efeito, certo? O que mais posso fazer para depurar a causa desses desligamentos?