Letztes Jahr habe ich eine neue externe Festplatte (Laufwerk 1) bekommen, die ohne Vorwarnung in weniger als 2 Monaten den Geist aufgab. Ich habe sie durch ein anderes, aber ebenfalls neues externes Laufwerk (Laufwerk 2) ersetzt, und jetzt, vier Monate später, hat auch dieses angefangen, den Geist aufzugeben. Ich habe ein zweites externes Laufwerk (Laufwerk 3), das mehrere Jahre alt ist und bisher einwandfrei funktioniert hat... bis jetzt. Es hat einfach angefangen, Fehler bei der Auslagerungsoperation zu melden.
Ich stecke diese Laufwerke überhaupt nicht ein und aus und bewege sie selten, selbst wenn mir einmal im Monat das zu viel ist. Berühren Sie sie nie, wenn sie sich drehen. Sie liegen ruhig flach in ihrer Ecke.
Alle drei Laufwerke waren über USB mit demselben Motherboard verbunden. Ich übertakte nichts, der Computer ist an eine einfache Steckerleiste mit Sicherung angeschlossen, die in die Wandsteckdose gesteckt wird. Ich habe auch zwei SSDs auf die alte Weise an das Motherboard angeschlossen, SATA+Strom vom Netzteil. Diese scheinen in Ordnung zu sein.
Anfang des Jahres gab es in meiner Region ein Stromproblem, das aber behoben wurde, und das erste Laufwerk ist vorher kaputt gegangen. Das Netzteil ist auch alt, ein Corsair CX430. Ich erlebe keine anderen klassischen Anzeichen für Netzteilausfälle, nur kaputte Festplatten.
Ich habe von verdächtigen Laufwerksfehlern gelesen und die meisten Leute verweisen auf fehlerhafte Netzteile, aber es geht immer um interne Festplatten, nicht um tragbare. Würde ich nicht auch andere Probleme sehen, wenn es das Netzteil wäre?
Vielleicht habe ich einfach Pech und zwei defekte Laufwerke hintereinander und das dritte nähert sich gerade dem Ende seiner Lebensdauer, aber wenn es nicht Pech ist, muss ich herausfinden, was los ist, denn es macht die Arbeit zu einem Albtraum. Ich brauche hier einen guten Aktionsplan, um das Problem zu diagnostizieren, aber ich bin ein bisschen ratlos. Ich weiß nicht, welche Tests ich am Netzteil durchführen könnte, um es in diesem Fall auszuschließen, noch welche Art von Tests ich am Motherboard durchführen könnte, wenn esdürfentatsächlich externe Laufwerke zerstören.
Bearbeitet, um zusätzliche Informationen hinzuzufügen
Ich identifiziere die Laufwerke wie folgt: Laufwerk 1: neu, fiel zuerst aus, ist nicht mehr bei mir; Laufwerk 2: neu, defekt; Laufwerk 3: alt, möglicherweise defekt.
Alle Laufwerke sind oder waren an USB 3.0-Anschlüsse in meinem Motherboard angeschlossen. Laufwerk 1 und 2 waren an denselben Anschluss angeschlossen, aber ich habe nach den Problemen alle anderen ausprobiert. Habe die Anschlüsse noch nicht genauer untersucht. Laufwerk 3 ist an einen anderen Hub oder Cluster von Motherboard-Anschlüssen angeschlossen. Sie sind weit voneinander entfernt und ich vermute, dass es sich um unterschiedliche Schaltkreise handelt:
An die übrigen USB-Anschlüsse habe ich Peripheriegeräte angeschlossen. Habe keine Anomalien festgestellt.
CrystalDisk-Messwerte mit SMART-Daten unten. Beide sind tragbare Festplatten für den Privatgebrauch mit 2,5 Zoll Innenleben.
Laufwerk 2 (neue externe Festplatte, derzeit defekt)
Chkdsk /r
Es wurden keine fehlerhaften Blöcke erkannt. Es kann gelesen und beschrieben werden und zeigt keine Fehler in der Ereignisanzeige an, wenn man es nicht beachtet. Bei normaler Verwendung treten jedoch beim Schreiben größerer Dateien (über 100 MB) folgende Ereigniswarnungen auf:
ID 51, warning
: „Bei einem Paging-Vorgang wurde auf dem Gerät (DISK) ein Fehler festgestellt.“ (ging dem ersten Schreibfehler voraus, ein sicheres Zeichen dafür, dass der Schreibvorgang bald wieder fehlschlagen wird)ID 153, warning
: „Der IO-Vorgang an der logischen Blockadresse 0x------ wurde wiederholt“ (gestartet nach dem ersten Fehler, der logische Block ändert sich, manchmal ist es 0x0)
Wenn Sie an dieser Stelle unbedingt schreiben möchten, folgt:
ID 140, warning
: „Das System konnte die Daten nicht in das Transaktionsprotokoll schreiben. (...) Fehlerstatus: {Laufwerk nicht bereit}“ (beim ersten Fehler)ID 154, error
: „Der IO-Vorgang an der logischen Blockadresse 0x------ ist aufgrund eines Hardwarefehlers fehlgeschlagen“ID 137, error
: „Der Standard-Transaktionsressourcen-Manager auf Datenträger D: hat einen nicht wiederholbaren Fehler festgestellt und konnte nicht gestartet werden. Die Daten enthalten den Fehlercode.“ID 140, warning
: „Das System konnte die Daten nicht in das Transaktionsprotokoll schreiben. (...) Fehlerstatus: Die Anforderung ist aufgrund eines schwerwiegenden Gerätehardwarefehlers fehlgeschlagen.“
Die ersten beiden Warnungen sind während der Nutzung nicht offensichtlich, aber sobald die Fehler auftreten, friert das Betriebssystem ein, bis ich es aus- und wieder einstecke. Das schlimmste Zeichen ist, dasswenn es nicht schreibt, klickt es. Es klickt zwar nicht ununterbrochen, aber ein Klick ist einer zu viel, oder?
Laufwerk 3 (altes externes Laufwerk, stottert derzeit)
Musste es chkdsk
zweimal ausführen, der Scan blieb beim ersten Versuch hängen. Meldet auch 0 fehlerhafte Sektoren.
Es werden auch stille Warnungen ausgegeben. Beides ist im Betrieb nicht zu erkennen, es kommt zu keinen Rucklern:
ID 153, warning
: „Der IO-Vorgang an der logischen Blockadresse 0x------ wurde wiederholt“ (Passiert schon seit einiger Zeit, der logische Block ändert sich, manchmal ist es 0x0)ID 51, warning
: „Bei einem Paging-Vorgang wurde auf dem Gerät (DISK) ein Fehler festgestellt.“ (gestern gestartet, sagt ebenfalls einen bevorstehenden Fehler voraus)
Seit gestern kommt es zufällig dazu, dass Software, die große Dateien (1 GB+) darauf schreibt, anhält und Fehler anzeigt. An diesem Punkt trennt es die Verbindung und stellt sie wieder her, danach ist es wieder erreichbar. Die Ereignisanzeige zeigt in diesen Momenten die folgenden Fehler an:
ID 50, warning
: "{Delayed Write Failed} } Windows konnte nicht alle Daten für die Datei D:(irgendwas) speichern" (ändert sich, manchmal ist es nur das Volume-Stammverzeichnis)ID 140, warning
: "Fehlerstatus: Es wurde ein Gerät angegeben, das nicht existiert. (...) Fehlerstatus: Es wurde ein Gerät angegeben, das nicht existiert."
Ich habe bisher kein Klicken davon gehört.
Laufwerk 1 (erstes neues externes Laufwerk, das ausgefallen ist, nicht mehr bei mir)
Außerdem traten Paging-Fehler (51) auf, die einige Tage lang unbemerkt blieben. Darauf folgten die folgenden, als das Schreiben auf das Laufwerk fehlschlug:
ID 7, warning
: „Das Gerät (DISK) hat einen fehlerhaften Block.“ID 154, error
: „Der IO-Vorgang an der logischen Blockadresse 0x------ ist aufgrund eines Hardwarefehlers fehlgeschlagen“
Es war plötzlich und fatal, es fror ein und danach war kein Zugriff mehr möglich. Ich habe versucht, zumindest einige Dateien wiederherzustellen, aber sie erschienen nicht einmal in DISKPART oder Linux. Außerdem war nach diesem Ereignis ein ständiges Klicken des Todes zu hören.
Edit 2: Das passiert nur bei höheren Motherboard-Temperaturen
Ich habe die vorgeschlagenen Tests durchgeführt, indem ich 5 GB große Dateien zwischen Festplatten unter verschiedenen Bedingungen übertragen habe, angefangen vom gleichen PC und Betriebssystem bis hin zu einem anderen PC und Betriebssystem. Als ich die Probleme nicht nur unter verschiedenen Bedingungen, sondern auch auf dem ursprünglichen PC nicht reproduzieren konnteUndBeim Betriebssystem fiel mir auf, dass sich in den Tagen, als die Festplatten anfingen, Probleme zu machen, und als ich den Test durchführte, ein Faktor geändert hatte: das Wetter.
Die Temperatur fiel um über 10ºC, als von einer Hitzewelle zu ungewöhnlich mildem Wetter überging. Heute ist es etwas wärmer. Ich konnte das Problem auf demselben PC und Betriebssystem zuverlässig reproduzieren. Ein fehlerhafter Lüfter half mir auch (Details am Ende).
Bei drei Festplatten stiegen die Temperaturen, als die Festplatte 2 den üblichen E/A-Fehler aufgrund eines Hardwarefehlers zeigte und einfror:
Die M.2-SSD mit dem Betriebssystem erreichte 79ºC. Sie befindet sich auf der Unterseite der Platine, direkt unter dem PCH.
Der PCH meldete über 59ºC.
Ein „Temperatur 5“-Sensor meldete 69ºC+. Ich vermute, das ist das VRM, kein anderer mysteriöser Sensor wird so heiß.
Das Senken der SSD-Temperatur hat die Fehler nicht behoben, das Erhöhen der PCH/Temp-5-Temperaturen jedoch schon. Bei diesen Werten funktionierte Festplatte 2 wieder einwandfrei:
Ich wusste, dass weder die CPU noch die GPU übermäßig heiß waren, aber ich habe nicht auf das Motherboard und schon gar nicht auf die SSD-Temperatur geachtet. Nach dem, was ich gelesen habe, sind diese Motherboard-Temperaturwerte nicht so hoch, aber dank des Lüfters sind sie heißer als sie normalerweise in meinem System werden (~50/60ºC).
Ich arbeite daran, die genaue Temperaturgrenze herauszufinden. Bisher liegt sie bei 59ºC PCH und 56ºC Temperatur 5, der niedrigsten Temperatur, bei der die Festplatte nicht mehr reagiert. Unter anderem verwaltet der PCH die USB-Daten und die Stromversorgung, nicht wahr?
Das Fan-Problem
Mein Gehäuse ist ein kleiner Faktor mit einem 120-mm-Lüfter an der Vorderseite. Ich habe das Original durch einen Kühlkörper/Lüfter von Watercooler ersetzt, der gleichzeitig als Abluft für den Computer dient. Er ist an den CPU_FAN angeschlossen und erfüllt seine Doppelfunktion gut. Er ist so alt wie alles andere in diesem Build, und ich habe die Standardkurve auf eine etwas aggressivere angepasst.
Beim Ausführen der Tests stellte ich fest, dass etwas mit dem Lüfter nicht stimmte: Er blieb auf der Mindestgeschwindigkeit hängen, obwohl er das nicht sollte. Er ignorierte die vom Windows-Motherboard-Dienstprogramm festgelegte Kurve, und Versuche, ihn mit konstanten 100 % zu drehen, führten dazu, dass er für einige Sekunden zufällig mit 100 % drehte, ohne die erwartete Rotationsgeschwindigkeit aufrechtzuerhalten. Er beachtete jedoch die UEFI-Einstellungen und begann wieder auf das Dienstprogramm zu reagieren, nachdem ich die Einstellungen über das UEFI geändert hatte.
Seltsam, aber ich glaube nicht, dass es die eigentliche Ursache des Problems ist. Es hat es nur verschlimmert, weil die Temperaturen schneller und höher stiegen. Ich befürchte, dass solche Temperaturen auf lange Sicht die Leistung einiger Komponenten beeinträchtigen, denn im Nachhinein betrachtet war mein Computer seit Jahresbeginn zu leise und wir hatten inzwischen vier oder fünf Hitzewellen.