Ich versuche derzeit herauszufinden, ob eine neue Festplatte, die ich vor ein paar Wochen gekauft habe, defekt ist oder ob es ein Problem mit dem SATA-Anschluss gibt (falls das überhaupt möglich ist).
Das Problem begann beim Hochfahren, der BIOS-Bildschirm zeigte, dass die Festplatte einen SMART-Fehler hatte und ich sie ersetzen sollte. Ich begann, Dateien von ihr zu kopieren, und nach mehreren Minuten des Kopierens der Dateien (mit rsync) begannen die Kopien fehlzuschlagen und das Laufwerk/die Dateien wurden unzugänglich. Ich sollte beachten, dass die gesamte Laufwerkspartition mit Veracrypt gemountet ist, sodass die Dateien unzugänglich blieben, bis ich die Partition in Veracrypt unmountete und erneut mountete, dann waren die Dateien wieder zugänglich.
Dasselbe Verhalten wiederholte sich, wobei die Verbindung immer häufiger unterbrochen wurde. Ich nahm an, dass sich dies lediglich auf die Verschlechterung des Laufwerks bezog.
Ich habe einen erweiterten SMART-Test für das Laufwerk ausgeführt und alles scheint in Ordnung zu sein:
Das brachte mich zum Nachdenken, ob das Problem wirklich bei der Festplatte lag. Meine beiden vorherigen Festplatten sind ebenfalls ausgefallen (ich glaube, am selben HD-Port, aber sie haben mindestens ein paar Jahre gehalten) und zeigten genau dasselbe Verhalten – sie gaben einen SMART-Fehler aus, funktionierten ein bisschen, begannen dann aber, die Verbindung zu trennen, und ließen sich schließlich überhaupt nicht mehr mounten.
Ich habe jetzt den Anschluss und das Kabel gewechselt, die die Festplatte verwendet, und konnte bisher ca. 130 GB davon kopieren. Ich werde weiterhin Dateien davon kopieren, um zu sehen, ob das Problem wieder auftritt. Aber kann ich sicher sein, dass der Fehler nicht wieder auftritt und das Problem bei der Festplatte liegt? Wenn es ein Problem mit der Festplatte gibt, möchte ich sie jetzt innerhalb der Rückgabefrist austauschen lassen.
Update: Das Kopieren schien problemlos zu funktionieren. Das Kopieren dorthin schien problemlos zu funktionieren, bis ich versuchte, das Laufwerk im Datei-Explorer zu durchsuchen, der jedoch keine Dateien anzeigte (und ein „ls“ in Bash ergab einen „Eingabe-/Ausgabefehler“), obwohl Rsync immer noch dorthin kopierte. Ich stoppte das Kopieren mit Rsync und stellte fest, dass sich der Einhängepunkt geändert hatte – er war ursprünglich auf /dev/sdd, jetzt aber auf /dev/sdf – ich gehe davon aus, dass er ausgehängt und automatisch neu eingehängt wurde, aber ich weiß nicht genug darüber, um das beurteilen zu können.
Ist es angesichts der immer noch auftretenden Probleme fair zu sagen, dass es sich lediglich um ein Laufwerksproblem handelt, auch wenn SMART offenbar funktioniert?
Bitte lassen Sie mich wissen, wenn ich Ihnen weitere Informationen geben kann.
Antwort1
Die Werte der SMART-Attribute deuten darauf hin, dass es sich um einen Schnittstellenfehler handelt.
- Die Platten sind vermutlich in Ordnung (0 stehen zur Verlagerung aus, 0 wurden verlagert, 0 sind defekt) und das Laufwerk ist angeblich nur eine Woche lang in Gebrauch (Einschaltstunden) und hat nur 43 Einschaltvorgänge erlebt, ist also im Grunde „neu“.
- UDMA CRC-Fehler bedeuten, dass das Kabel oder der Port defekt war oder etwas anderes auf der Schnittstellenebene. Es könnte auch ein defekter SATA-Controller im Motherboard oder Controller im Gerät sein. Aber solche Probleme sindseltenSie äußern sich häufig inÜberhitzungeiniger Komponenten; der SATA-Controller ist oft in die "South Bridge" des Motherboards eingebaut. Suchen Sie nach einem großen Chip in der Nähe der SATA-Anschlüsse. Manchmal hat er einen Kühlkörper. Versuchen Sie, ihn zu berühren. Er sollte nichtzuheiß. Versuchen Sie, einen Lüfter anzuschließen und prüfen Sie, ob das Problem dadurch behoben wird.
- Häufiger werden Probleme verursacht durchschlechte Macht. Überprüfen Sie Ihr Netzteil. Liefert es die erwartete Leistung oder driftet seine Spannung manchmal außerhalb des zulässigen Bereichs (±5 %, z. B. müssen 12 V zwischen 11,4 V und 12,6 V liegen usw.). Manchmal verfügt das Motherboard über Sensoren, die vom Betriebssystem aus verwendet werden können, um die Netzteilspannung zu überwachen. Versuchen Sie es mit
sensors
einem Programm vonlm_sensors-Projekt; dafür sollte es GUIs geben, aber ich habe sie nie ausprobiert.
Antwort2
Normalisierte Werte für SMART-Variablen beginnen bei den Werten 100 oder 200 und sinken bei Fehlern, bis sie den Schwellenwert erreichen, bei dem die Firmware einen Alarm auslöst.
Das Merkwürdige an Ihren SMART-Daten ist, dass Sie eine „Lesefehlerrate“ und „Suchfehlerrate“ hatten, sonst aber nichts, insbesondere keine Schreibfehler, die man von einer fehlerhaften Festplatte erwarten würde.
Es scheint, dass die Festplatte keine Probleme beim Schreiben der Daten hat, sobald der entsprechende Befehl die Firmware erreicht. Beim Lesen der Festplatte treten jedoch manchmal Fehler auf, bei denen es sich anscheinend nicht um schwerwiegende Fehler handelt.
Ich vermute, dass es sich um einen Kommunikationsfehler zwischen dem Computer und der Festplatte handelt. Ich würde vorschlagen, das SATA-Kabel zu überprüfen oder ein anderes von hoher Qualität auszuprobieren. Überprüfen Sie alle Kontakte und auch, ob das Kabel gut abgeschirmt ist.
Ich weise darauf hin, dass alles, was wir hier sagen können, nur eine Vermutung ist. Wenn Sie sich nicht sicher sind, bitten Sie einen Fachmann um eine Überprüfung.