Mi sistema de escritorio comenzó a experimentar fallas aleatorias de BSOD en las últimas 2 semanas.
No hay ningún patrón para los fallos, cada uno es un código de parada diferente, en un módulo del kernel diferente, lo que para mí indica problemas de memoria.
Ejecuté Memtest86 y apareceMILESde errores, en un rango específico de ubicaciones entre 0x150000000
y 0x170000000
(es decir, entre 5376 MB y 5888 MB).
El patrón de bits de error es siempre 0x00240000
, lo que significa que la discrepancia entre lo que se escribe y lo que se lee siempre está solo en esos dos bits. Además, no es un bit atascado, ya que la discrepancia en cualquier posición de bit es un bit invertido y no siempre tiene el mismo valor. Como ejemplo, en un error el patrón escrito es 0x80808080
pero lo que se lee es
0x80848080
(un bit cero invertido a uno), pero cuando el patrón es
0x7F7F7F7F
el valor leído es 0x7F7B7F7F
(un bit invertido a cero).
Si elimino un módulo y pruebo cada módulo por sí solo, Memtest86 informa CERO errores.
Si coloco ambos módulos, el rango de direcciones de error es el mismo independientemente de la forma en que se inserten los módulos. Es decir, si los cambio, el rango de direcciones de error no cambia.
La placa base tiene 4 ranuras de memoria etiquetadas como A1, A2, B1, B2. El manual recomienda que cuando utilice 2 módulos utilice A2/B2. También intenté usar A1/B1 pero esto resultó en exactamente el mismo rango de direcciones de error.
Dado:
- Los módulos prueban individualmente OK
- El rango de direcciones fallidas no cambia cuando cambio los módulos
- El rango de direcciones fallidas no cambia cuando uso las ranuras de memoria alternativas
Esto suena terriblemente como si el problema estuviera "aguas arriba" de los zócalos y módulos de memoria, y mi placa base está tostada.
Pregunta: ¿Existe otra posible explicación para esto? ¿Existen otros pasos de diagnóstico que pueda seguir para identificar dónde está el problema?
Algunos detalles en caso de que sean necesarios:
- tarjeta madre: ASUS Z97-WS, en servicio sin problemas desde 2014/09 hasta ahora
- Memoria: 2 Kingston KHX1866C10D3/8G (en la lista de compatibilidad de ASUS)
- UPC: Intel Core i7-4790K a 4,00 GHz (sin overclocking)
Respuesta1
El problema resultó ser una de las dos tarjetas de memoria de 8 GB.
La ambigüedad surgió del hecho de que mostraba errores sólo cuando se ejecutaba en modo de doble canal, es decir, sólo cuando ambos dispositivos estaban en el sistema. Cuando cada dispositivo se instaló por sí solo en la placa base, no se informaron errores.
Decidí que quería aumentar la memoria de mi sistema de todos modos, así que compré 16 GB adicionales. Si un dispositivo fuera malo, terminaría con 24 GB, y si fuera la placa base, terminaría con 32 GB (después de una dolorosa reconstrucción del sistema).
Después de instalar los nuevos 16 GB, probé los dos dispositivos antiguos uno a la vez. Uno produjo errores inmediatamente y el otro realizó varias pasadas completas de Memtest86 sin errores.
Conclusión: Un dispositivo de 8 GB había desarrollado errores. Evité el reemplazo de MB y la reconstrucción del sistema, y ahora soy un campista feliz con 24 GB, suficientes para hacer algunas panorámicas realmente grandes en Lightroom :-)
Editar: descubrí que la memoria tiene una garantía de por vida (Kingston) y la devolví para que la reemplacen. Tendré 32 GB después de todo :-)