¿Cuál es la causa más probable del sistema inestable?

¿Cuál es la causa más probable del sistema inestable?

Tenía un sistema estable, i7 basado en Intel, Asus ROG RAMPAGE V EDITION 10, luego actualicé a una placa base ROG ZENITH II EXTREME con la nueva CPU Threadripper, 3960X. Todas las demás piezas eran del sistema original, CPU y placa base nuevas, y un enfriador AOI adecuado eran solo piezas nuevas.

El sistema se volvió inestable, se congeló aleatoriamente y se encendió y se encendió aleatoriamente. Cinco veces al día, al menos. Reemplazo la CPU y el sistema estuvo estable durante 20 días y luego comenzó a ser inestable nuevamente.

Me reemplazaron la placa base, pero ese modelo ya no estaba disponible. Así que pedí una nueva placa base ROG ZENITH II EXTREME ALPHA. Esto parecía haber solucionado el problema, se congelaba y se apagaba todos los días y eso prácticamente desapareció. Pensé que había resuelto el problema.

Ahora he tenido el sistema funcionando durante tres meses y he tenido una congelación y dos ciclos de encendido. Así que no sé cuál podría ser el problema. Reemplazar CPU + Mobo evitó que fallara 5 veces al día, por lo que es mucho más estable, pero ¿qué es lo más probable que cause esto? Además, ¿por qué ahora se cuelgan y bloquean con poca frecuencia? ¿Quizás mi fuente de alimentación o mi RAM?

Además, mi tienda de informática local reprodujo el problema solo con la CPU y la placa base, pero se mantuvo estable durante dos días hasta que lo probamos con la tarjeta raid Asus m.2 hyper x16 SSD. ¿Podría ser un problema con la tarjeta Raid? Probé dos tarjetas raid Gigabyte y luego cambié al modelo Asus, así que probé diferentes marcas y modelos. ¿Quizás un problema de ancho de banda que solo ocurre con las unidades NVMe Raided?

Resumen

Piezas nuevas: placa base, CPU y enfriador AIO.

El sistema se volvió inestable.

Reemplazado: CPU y luego placa base.

El sistema se volvió mucho más estable, pero aún ocasionalmente se congela y se reinicia.

No sé qué intentar reemplazar a continuación. Espero que alguien pueda sugerir la causa más probable, de lo contrario tendré que construir una máquina completamente nueva desde cero y eso no está actualmente en mi presupuesto.

Respuesta1

La causa más común de reinicios o bloqueos del sistema son los dispositivos y controladores de dispositivos incompatibles.

Le sugerimos que siga los siguientes pasos para aislar el problema:

  1. Asegúrese de haber instalado la última versión UEFI para la placa base y cualquier otra actualización de firmware para sus componentes, tarjeta gráfica, etc. Restablezca su placa base a los valores predeterminados de fábrica.

  2. Para aislar si el problema es causado por hardware o software, inicie desde un Live CD de Linux. Por ejemplo, inicie una llave USB con Linux Mint 20 Cinnamon.https://www.linuxmint.com/download.php Si puede recrear el bloqueo que se ejecuta en el Live CD de Linux, le indicará que el problema está relacionado con el hardware y no con su sistema operativo ni con los controladores del sistema operativo.

  3. Si está relacionado con el hardware, lleve su sistema al mínimo y vuelva a agregar componentes gradualmente. Por ejemplo, si tiene 4 atenuadores de memoria, ejecútelo con solo 1 o 2 atenuadores. Mediante el intercambio, vea si puede aislarlo de un componente defectuoso. Definitivamente vuelva a colocar los atenuadores y asegúrese de que las conexiones doradas estén limpias.

  1. No menciona qué sistema operativo está ejecutando, pero consulte los registros del sistema para obtener información sobre errores. Registros de aplicaciones y sistemas de Windows.

Respuesta2

Si la CPU se congela, normalmente la pantalla se congelará (según mi experiencia, pero no siempre)

Si la RAM está corrupta, normalmente se reiniciará o realizará un volcado de bsod. (nuevamente en mi experiencia, y otra vez... no siempre)

Si la GPU está defectuosa, generalmente hay una imagen corrupta y el servidor de visualización se reinicia. También puede simplemente BSOD y reiniciar...

La única manera de saberlo es cambiando las piezas, en este caso el ariete.

Lo que probablemente no sea...

Probablemente no sea la fuente de alimentación; por lo general, simplemente se sobrecalientan y mueren, pero PODRÍA tener una tensión insuficiente, lo que PODRÍA suceder durante los juegos (y probablemente solo)

Probablemente no sean las unidades de disco. obtendrías un BSOD obvio (algún error de IO...)

PODRÍA ser algún periférico USB defectuoso; eso ya sucedió una vez antes, pero es raro.

Siempre... la resolución de problemas es realmente la única forma de averiguarlo.

Reemplazaste la placa y el procesador... Quedan GPU y RAM. (razonablemente)

información relacionada