Fallos frecuentes en aplicaciones con uso intensivo de gráficos: ¿se está muriendo mi GPU?

Fallos frecuentes en aplicaciones con uso intensivo de gráficos: ¿se está muriendo mi GPU?

Recientemente comencé a tener fallas extrañas en juegos como Dark Souls o GRIP: Combat Racing. En teoría, mi GTX 1080 debería poder manejarlos sin problemas. Los fallos suelen aparecer de forma aleatoria después de un tiempo de juego.

Lo que me hace pensar que es la GPU es que las aplicaciones fallan al mismo tiempo. Por ejemplo: Dark Souls y OBS Studio. A veces, después de un tiempo, todo el controlador de la GPU parece fallar: la pantalla se vuelve negra, luego solo regresa la pantalla principal, pero no el segundo monitor, y las cosas de composición como la transparencia ya no funcionan.

Saqué y limpié la tarjeta lo mejor que pude, pero eso no pareció cambiar nada.

Decidí reinstalar Windows por completo para descartar problemas de software. Luego, después de instalar los controladores, ejecuté Furmark, que se bloqueó después de unos segundos, e intenté ejecutar GRIP, que se bloqueó poco después de comenzar una carrera.

He tenido esta GPU solo durante aproximadamente un año y esto nunca había sucedido antes hace una semana, aunque la compré usada.

Alguna información del sistema:

  • Nombre del sistema operativo Microsoft Windows 10 Pro Versión 10.0.19045 Compilación 19045
  • Tipo de sistema PC basada en x64 Procesador AMD Ryzen 5 5500, 3600 Mhz, 6
  • Núcleo(s), 12 Procesador(es) lógico(s) Fabricante de placa base Micro-Star
  • International Co., Ltd Producto de placa base B450 GAMING PLUS MAX (MS-7B86)
  • Adaptador de memoria física (RAM) instalada de 16,0 GB
  • Descripción NVIDIA GeForce GTX 1080 Adaptador RAM (1.048.576) bytes
  • Versión del controlador 31.0.15.3640 Resolución 1920 x 1080 x 60 hercios

A continuación se muestran algunos ejemplos de informes de fallos copiados del visor de eventos:

Nombre de la aplicación con errores: DARKSOULS.exe, versión: 1.0.2.0, marca de tiempo: 0x557f2fd0 Nombre del módulo con errores: d3d9.dll, versión: 0.0.0.0, marca de tiempo: 0x5b71c6f0 Código de excepción: 0xc0000005

Nombre de la aplicación con errores: obs-browser-page.exe, versión: 0.0.0.0, marca de tiempo: 0x63b8a351 Nombre del módulo con errores: KERNELBASE.dll, versión: 10.0.19041.2130, marca de tiempo: 0xb0fac6c9 Código de excepción: 0xe0000008

Nombre de la aplicación con errores: dwm.exe, versión: 10.0.19041.746, marca de tiempo: 0x6be51595 Nombre del módulo con errores: KERNELBASE.dll, versión: 10.0.19041.2130, marca de tiempo: 0xb0fac6c9 Código de excepción: 0xc00001ad

Se ha detectado un TDR. La aplicación debe cerrarse. Código de error: 7 (pid=7600 tid=3384 furmark.exe 32 bits)

Nombre de la aplicación con errores: FurMark.exe, versión: 1.35.0.0, marca de tiempo: 0x64933012 Nombre del módulo con errores: nvoglv32.dll, versión: 31.0.15.3640, marca de tiempo: 0x649602c9 Código de excepción: 0xc0000409

Nombre de la aplicación con errores: Grip-Win64-Shipping.exe, versión: 4.17.2.0, marca de tiempo: 0x62511845 Nombre del módulo con errores: nvwgf2umx.dll, versión: 31.0.15.3640, marca de tiempo: 0x6496040f Código de excepción: 0xc0000005

Para el bloqueo de GRIP, una ventana emergente de error de Unreal Engine decía algo así como "error fatal de bajo nivel, pero desapareció antes de que pudiera copiarlo. Al monitorear los sensores de GPU con GPU-Z, parece que el bloqueo ocurre durante un breve pico de carga de GPU :

Lecturas de GPU-Z

El motivo de PerfCap es "vRel".

¿Cómo puedo diagnosticar esto más a fondo? ¿Hay alguna esperanza para mi tarjeta gráfica? ¿Hay algo que pueda hacer para solucionar este problema sin tener que reemplazarlo?

Editar: Me acabo de dar cuenta de que como tengo la versión MSI del 1080 (específicamente GAMING X 8G), está overclockeado de serie. Eliminé el OC habilitando el modo de depuración de Nvidia y hasta ahora GRIP parece ser estable, con picos de carga de GPU por debajo del 100%. Pero GRIP no es el juego más exigente y estoy bastante seguro de que ya tenía activado el modo de depuración cuando empezaron a producirse los fallos. Es posible que lo haya desactivado restableciendo la configuración de mi controlador en la solución de problemas inicial. Todavía parece extraño que una GPU que se ejecuta con overclock estándar sea tan inestable.

Edición 2: estoy usando una fuente de alimentación Corsair CS650M de alrededor de 2015, utilizada en la versión anterior. ¿Quizás la GPU simplemente no recibe suficiente potencia? Ciertamente prefiero reemplazar la fuente de alimentación que la GPU. Según la calculadora de PSU de Newegg, mi sistema solo requiere 600 W, pero me doy cuenta de que mi PSU es bastante antigua y, según algunas fuentes, la degradación de la potencia es un problema.

información relacionada