Pánico en el kernel y corrupción de la memoria al operar computadoras portátiles sin batería incorporada

Pánico en el kernel y corrupción de la memoria al operar computadoras portátiles sin batería incorporada

Perdón de antemano por la publicación tan larga, pero creo que es necesario algo de contexto/historia de fondo.

Estuve usando una vieja computadora portátil para juegos Asus GL502VM durante aproximadamente 7 años con Windows 10, conectada todo el tiempo como una especie de PC de escritorio. La batería falló (parcialmente, inflada con una celda caída) por segunda vez hace unas semanas y, en lugar de reemplazarla por otra, decidí operarla sin batería. No estaba jugando, pero unas semanas después recibí un BSOD de Windows quejándose de un fallo de memoria. Ejecuté la herramienta de diagnóstico de memoria de Windows al reiniciar y la memoria tenía muchas direcciones fallidas.

Es importante tener en cuenta que esta computadora portátil tenía 8 GB de memoria soldada cuando la compré e inmediatamente después agregué una memoria USB de 8 GB a una ranura libre. Me había olvidado por completo del primero y decidí que la palanca que podía ver al abrir el panel trasero se había estropeado. Pasaron unos días hasta que llegó un dispositivo de 16 GB recién comprado y, después de algunos servicios generales (desempolvar, limpiar, pasta térmica nueva), agregar el nuevo dispositivo y ejecutar los diagnósticos de memoria todavía produjo errores de memoria. Fue en este punto que quité el nuevo dispositivo, ejecuté los diagnósticos solo con la RAM soldada y me decepcionó encontrar los errores nuevamente.

Decidí comprar una nueva computadora portátil pensando que la RAM soldada se había estropeado, esta vez una modesta Lenovo V15 G2 que no es para juegos. Se eliminó Windows 11 preinstalado e instaló LMDE 5 (Linux Mint Debian Edition). Como estaba usando esto como computadora de escritorio la mayor parte del tiempo y recordando las fallas pasadas de la batería, decidí desconectar la batería y usar la fuente de alimentación SMPS proporcionada. Unos días más tarde, esta computadora portátil también sufrió frecuentes ataques de pánico en el kernel cuando usaba incluso un poco de GPU, como ver Youtube o iniciar sesión en un DE en virt-manager. Ejecuté memtest86 y encontré daños en la memoria en la nueva computadora portátil. Después de algunos mini ataques cardíacos y de cuestionar mi existencia, finalmente lo solucioné presionando prolongadamente el botón de encendido para descargar completamente el dispositivo y reinstalando la batería. Ejecuté memtest nuevamente sin errores y sin más pánicos en el kernel.

Decidí revisar la vieja computadora portátil nuevamente, esta vez asegurándome de presionar prolongadamente el botón de encendido y ejecutar memtest, ¡no hubo errores!

Necesito ayuda para encontrar la causa raíz del problema:

  1. segúnesteRespuesta del superusuario, podría deberse a que el adaptador de corriente original no proporciona la energía adecuada por sí solo. ¿Cuál es la mejor manera de medir el consumo de energía? Tengo un enchufe inteligente con WiFi, pero no estoy seguro de si puede registrar picos momentáneos en el consumo de energía.
  2. No tengoimportanteRazón para dudar de la calidad de la electricidad, ya que tengo las computadoras portátiles conectadas a un UPS APC (uno normal, no el sofisticado de doble conversión) y un terminal SPD. Mi única preocupación es el voltaje NE bastante alto de 10-20 V, que está muy por encima de los 3 V recomendados por IEEE, esto no ha causado ningún problema AFAICT y anteriormente he utilizado una computadora portátil Xiaomi diferente sin batería incorporada durante algunos años sin ningún problema. Problemas de corrupción de memoria.

Respuesta1

El problema en diferentes portátiles (antiguos y nuevos) se debía a múltiples problemas no relacionados entre sí.

  1. En un portátil viejo (supuesto): debido al polvo y/o al sobrecalentamiento. Se solucionó después de limpiar y descargar el dispositivo por completo.

Actualización del 6 de octubre de 2023

No he podido reproducir el problema con mi vieja computadora portátil, pero es interesante notar que en el momento del problema la estaba operando con la placa posterior abierta (para una mejor refrigeración) y estaba sentado justo debajo de un largo ventilador de aire acondicionado. línea que podría haber causado interferencia EMI. He estado lidiando con problemas EMI similares que ocurren en otra habitación donde la línea eléctrica y los cables de audio y video están colocados en lados opuestos de la habitación (ancho estrecho), pero aun así causaron que el video HDMI se cortara durante un arranque en frío del aire acondicionado.

  1. En una computadora portátil nueva (confirmada): el uso de módulos de memoria no coincidentes provocó que la GPU integrada que comparte la RAM del sistema fallara. Memtest86 no informó problemas con los módulos no coincidentes, ya que solo prueba la CPU y la RAM. Se solucionó después de cambiar el módulo adicional/stick para que coincida con el soldado.

En cuanto al consumo de energía

Según algunas mediciones aproximadas del consumo de energía tomadas con una toma wifi inteligente, la computadora portátil Lenovo V15 con su cargador/adaptador predeterminado de 65 W y la batería incorporada desconectada no consume más de 40 W bajo pruebas de esfuerzo simultáneas de CPU, GPU y E/S. Solo cuando la batería está conectada y se está cargando y bajo prueba de estrés, extrae el máximo de 65 W del cargador. Usar el portátil con la batería incorporada desconectada no supone ningún problema.

información relacionada