
Seit einigen Monaten kommt es bei mir immer wieder vor, dass mein Desktop-Rechner einfriert. Dabei friert der Bildschirminhalt inkl. Maus ein, ich kann über die Tastatur keinen Neustart durchführen oder auf eine virtuelle Konsole wechseln und SysRq-Sequenzen bleiben wirkungslos – ein Kaltstart über den Knopf am Gehäuse ist dann nur noch möglich.
Ich verwende hauptsächlich Debian 11.6 und nur gelegentlich Windows 11 zum Spielen. Beim Spielen habe ich noch nie Einfrierungen erlebt, aber das liegt vielleicht einfach daran, dass ich so wenig Zeit damit verbringe.
Inkonsistente Hinweise:
Die Frostperioden begannen im Sommer, als es hier eine Hitzewelle gab (> 40 °C). Ich dachte also, es liege an der Überhitzung, und tatsächlich kam es im Herbst und Winter seltener zu Frostperioden – aber sie hörten nicht ganz auf. Früher passierte es alle 1 oder 2 Tage, jetzt passiert es vielleicht einmal pro Woche.
Das Einfrieren tritt häufig auf, wenn ich Videos im Vollbildmodus ansehe, und manchmal (aber nicht immer) erscheint ein farbiges Muster, als ob zufällige Daten in den Videospeicher geschrieben würden. Daher dachte ich, es könnte ein Problem mit der Grafikkarte sein. (Ich habe VDPAU installiert, daher verwenden Programme möglicherweise Hardware-Dekodierung.) Allerdings kommt es auch bei normaler Desktop-Nutzung zum Einfrieren.
Diagnostik:
Ich habe mir das Systemprotokoll nach dem Neustart angesehen, aber es gibt keine relevanten Informationen. Die letzten Einträge sind oft Minuten früher und beziehen sich auf Standardsystemereignisse. Dies kann aber einfach bedeuten, dass die letzten Nachrichten aufgrund des Einfrierens verloren gegangen sind.
Ich habe den CPU-Belastungstest verwendet, der auf
dd if=/dev/zero of=/dev/null
basiertComputer friert unregelmäßig ein, mit 7 parallelen Jobs (CPU ist 4-Core mit Hyperthreading).htop
zeigte alle 8 virtuellen Kerne bei 100 %, aber dies führte nach ~10 Minuten nicht zu einem Einfrieren.Ich habe beide installiert
memtest86
undmemtest86+
den Speichertest aus dem Bootmenü gestartet. Bei beiden Varianten friert der Rechner nach ca. einer Sekunde ein, allerdings ohne Fehlermeldung. Bildschirmfotos siehe unten.Bedeutet das, dass mein Speicher fehlerhaft ist? Ich hätte gedacht, dass ich stattdessen eine Fehlermeldung erhalten würde. Außerdem bearbeite ich häufig große Datendateien und habe nie eine Beschädigung der Dateidaten bemerkt. Ich führe auch gelegentlich wissenschaftliche Berechnungen durch, die dazu neigen, den Hauptspeicher zu füllen, und habe dabei auch nie ein Einfrieren erlebt. (Ich habe das System jedoch regelmäßig durch übermäßiges Swapping in die Knie gezwungen.)
Die einzige Möglichkeit, die ich gefunden habe, um ein Einfrieren konstant und schnell auszulösen, ist der Speichertest.
Fragen:
Wenn es tatsächlich an einem fehlerhaften Speicher liegt, wie finde ich heraus, welches der vier Speichermodule ich austauschen muss? Oder sollte ich immer alle austauschen?
Ich habe unter mehreren ähnlichen Fragen gelesen, dass Einfrieren auf ein defektes Netzteil zurückzuführen sein kann. Ich habe mein Netzteil vor etwa 1,5 Jahren ausgetauscht, weil das alte den Geist aufgegeben hatte. Ursprünglich wollte ich genau das gleiche Modell verwenden, das jedoch nicht mehr hergestellt wurde, also habe ich eines mit etwas höheren Spezifikationen verwendet. Ich habe die Gelegenheit genutzt, um das Gehäuseinnere gründlich zu reinigen.
Was kann ich tun, um dieses Problem softwareseitig besser zu diagnostizieren? Insbesondere, wie kann ich Protokollmeldungen bis zum Einfrieren aufbewahren? Debian 11 verwendet systemd-Protokollierung – gibt es beispielsweise eine Möglichkeit, stattdessen oder zusätzlich Meldungen an einen Server zu senden?
Systemspezifikationen:
- ASUSTeK COMPUTER INC. P8Z77-M Rev 1.xx mit SMBIOS 2.7
- American Megatrends Inc. BIOS-Version 1806
- Straight Power 11 750W 750W ATX Schwarz
- Intel(R) Core(TM) i7-3770 CPU @ 3,40 GHz
- 256 KiB L1-Cache, 1 MiB L2-Cache, 8 MiB L3-Cache (L3 scheint deaktiviert zu sein, ich kann mich nicht erinnern, das getan zu haben)
- Intel Corporation 7 Series/C216-Chipsatz
- 4 Module à 4 GB Transcend JM1333KLN-8GK DIMM DDR3 Synchronous 1333 MHz (0,8 ns)
- NVIDIA Corporation GP106 [GeForce GTX 1060 6 GB] (Version A1)
- SAMSUNG SSD 830 Series & WDC WD60EFRX, beide ohne SMART-Fehler
Der Computer ist etwa 10 Jahre alt, es wäre also nicht so schlimm, einen neuen kaufen zu müssen. Ich habe in der Zwischenzeit mehrere kleine Upgrades vorgenommen (mehr Speicher, etwas bessere CPU, bessere Grafikkarte), aber keines davon ist so neu, dass es die Einfrierungen erklären würde.
Bildschirmfotos vom Speichertest nach dem Einfrieren:
Im zweiten Bildschirm blinkt das rote „+“ nach dem Einfrieren weiter, was darauf hinweist, dass die Grafikkarte noch funktioniert.
Ergänzungen:
Als Antwort auf @Appleodditys Kommentar habe ich die Speichermodule herausgenommen. Sie sitzen fest in ihren Steckplätzen und sind einschließlich der Kontakte sauber. Als ich sie wieder einsetzte, bemerkte ich, dass sie manchmal so aussehen, als seien sie eingesetzt, aber tatsächlich nicht richtig sitzen. Das lässt sich durch einen kräftigen Druck beheben. Wenn das passiert, bekomme ich jedoch keine Speicherfehler, aber der Computer startet überhaupt nicht.
Falls nur eines der Module defekt ist, habe ich sie einzeln eingebaut und den Speichertest ausgeführt. Für jedes einzelne Modul wurden jedoch alle Tests ohne Fehlermeldung und ohne Einfrieren durchlaufen.
Dann habe ich sie paarweise eingegeben. Ich bin nicht sicher, ob ich alle 6 Kombinationen durchbekommen habe, aber bei allen Kombinationen, die ich probiert habe, ist der Computer nach ein paar Sekunden im Speichertest eingefroren.
Schließlich habe ich das Mainboard-BIOS aktualisiert (auf die neueste Version, 2203 vom 18.12.2015), in der Hoffnung, dass es das Problem irgendwie löst oder zumindest eine bessere Diagnose liefert, aber ohne Erfolg. Ich habe auch versuchtReduzierungdie Speichertaktrate im BIOS-Setup, bekam aber die Fehlermeldung, dass das „Übertakten“ nicht erfolgreich war.
Gibt es noch etwas, was ich versuchen kann? Soll ich einfach ganz neue Speichermodule kaufen?