Ersetzen Sie Ihre SSD

Ersetzen Sie Ihre SSD

Die SSD meines Laptopsist verrückt geworden und die Zahl der Fehler ist seit derdas letzte Mal, als ich gepostet habe.

Ist dieses Laufwerk tot / stirbt es?
Es ist jetzt eingeschaltet und ich schreibe dies darauf - ich habe alle meine Daten gesichert und alles, aber ich bin immer noch nicht sicher, ob es verwendbar ist oder nicht?

Die Kontaktaufnahme mit dem Hersteller hat nicht viel geholfen: Sie baten mich, Windows zu installieren und von dort aus das Dienstprogramm zur Datenträgerprüfung auszuführen oder es als externes Laufwerk an einen Windows-Host anzuschließen und es dort zu testen.
Ich habe beides getan und es sind keine Fehler aufgetreten.

Ich habe es auch mit dem von ihnen bereitgestellten Dienstprogramm überprüft (siehe Screenshot unten). Dann habe ich das mit Clonezilla erstellte Image verwendet, um zu Ubuntu zurückzukehren, und festgestellt, dass die Anzahl der SATA-PHY-Fehler bei fast 300 liegt!

Die Anschlüsse habe ich auch geprüft, da die SSD aber in einem Laptop steckt, kann ich das Kabel nicht (so einfach) wechseln.

Dies sind die Testergebnisse des Dienstprogramms des Herstellers

Testergebnisse

Und die smartctlAusgabe unter Ubuntu später:

smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.14.0-041400-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org

=== START OF INFORMATION SECTION ===
Device Model:     SPCC Solid State Disk
Serial Number:    XXXXXXXXXX
Firmware Version: S9FM02.8
User Capacity:    120,034,123,776 bytes [120 GB]
Sector Size:      512 bytes logical/physical
Rotation Rate:    Solid State Device
Form Factor:      2.5 inches
Device is:        Not in smartctl database [for details use: -P showall]
ATA Version is:   ACS-3 (minor revision not indicated)
SATA Version is:  SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is:    Sun Feb 18 02:22:56 2018 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED

General SMART Values:
Offline data collection status:  (0x00) Offline data collection activity
                    was never started.
                    Auto Offline Data Collection: Disabled.
Self-test execution status:      (   0) The previous self-test routine completed
                    without error or no self-test has ever 
                    been run.
Total time to complete Offline 
data collection:        (   30) seconds.
Offline data collection
capabilities:            (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported.
SMART capabilities:            (0x0003) Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer.
Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported.
Short self-test routine 
recommended polling time:    (   1) minutes.
Extended self-test routine
recommended polling time:    (   2) minutes.
Conveyance self-test routine
recommended polling time:    (   2) minutes.

SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000a   100   100   000    Old_age   Always       -       0
  9 Power_On_Hours          0x0012   100   100   000    Old_age   Always       -       6352
 12 Power_Cycle_Count       0x0012   100   100   000    Old_age   Always       -       2717
168 Unknown_Attribute       0x0012   100   100   000    Old_age   Always       -       0
170 Unknown_Attribute       0x0013   100   100   010    Pre-fail  Always       -       25
173 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       105447539
192 Power-Off_Retract_Count 0x0012   100   100   000    Old_age   Always       -       77
194 Temperature_Celsius     0x0023   070   070   000    Pre-fail  Always       -       30
196 Reallocated_Event_Count 0x0000   100   100   000    Old_age   Offline      -       0
218 Unknown_Attribute       0x0000   100   100   000    Old_age   Offline      -       15431
241 Total_LBAs_Written      0x0012   100   100   000    Old_age   Always       -       6281157

SMART Error Log Version: 1
ATA Error Count: 298 (device log contains only the most recent five errors)
    CR = Command Register [HEX]
    FR = Features Register [HEX]
    SC = Sector Count Register [HEX]
    SN = Sector Number Register [HEX]
    CL = Cylinder Low Register [HEX]
    CH = Cylinder High Register [HEX]
    DH = Device/Head Register [HEX]
    DC = Device Command Register [HEX]
    ER = Error register [HEX]
    ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.

Error 298 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:08.077  [VENDOR SPECIFIC]
  ca 00 80 b0 8f 12 e1 00      00:11:08.076  WRITE DMA
  ca 00 80 30 8f 12 e1 00      00:11:08.076  WRITE DMA
  ca 00 80 b0 8e 12 e1 00      00:11:08.075  WRITE DMA
  ca 00 80 30 8e 12 e1 00      00:11:08.074  WRITE DMA

Error 297 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:08.039  [VENDOR SPECIFIC]
  ca 00 80 b0 7c 12 e1 00      00:11:08.038  WRITE DMA
  ca 00 80 30 7c 12 e1 00      00:11:08.038  WRITE DMA
  ca 00 80 b0 7b 12 e1 00      00:11:08.037  WRITE DMA
  ca 00 80 30 7b 12 e1 00      00:11:08.037  WRITE DMA

Error 296 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.974  [VENDOR SPECIFIC]
  ca 00 80 b0 48 12 e1 00      00:11:07.973  WRITE DMA
  ca 00 80 30 48 12 e1 00      00:11:07.972  WRITE DMA
  ca 00 80 b0 47 12 e1 00      00:11:07.972  WRITE DMA
  ca 00 80 30 47 12 e1 00      00:11:07.972  WRITE DMA

Error 295 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.927  [VENDOR SPECIFIC]
  ca 00 80 b0 2a 12 e1 00      00:11:07.926  WRITE DMA
  ca 00 80 30 2a 12 e1 00      00:11:07.925  WRITE DMA
  ca 00 80 b0 29 12 e1 00      00:11:07.925  WRITE DMA
  ca 00 80 30 29 12 e1 00      00:11:07.924  WRITE DMA

Error 294 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
  When the command that caused the error occurred, the device was active or idle.

  After command completion occurred, registers were:
  ER ST SC SN CL CH DH
  -- -- -- -- -- -- --
  84 51 01 01 00 00 00

  Commands leading to the command that caused the error were:
  CR FR SC SN CL CH DH DC   Powered_Up_Time  Command/Feature_Name
  -- -- -- -- -- -- -- --  ----------------  --------------------
  ff d5 01 01 00 00 00 ff      00:11:07.899  [VENDOR SPECIFIC]
  ca 00 80 b0 22 12 e1 00      00:11:07.898  WRITE DMA
  ca 00 80 30 22 12 e1 00      00:11:07.897  WRITE DMA
  ca 00 80 b0 21 12 e1 00      00:11:07.897  WRITE DMA
  ca 00 80 30 21 12 e1 00      00:11:07.896  WRITE DMA

SMART Self-test log structure revision number 1
Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Short offline       Completed without error       00%      6288         -
# 2  Conveyance offline  Completed without error       00%      6285         -
# 3  Short offline       Completed without error       00%      6285         -
# 4  Extended offline    Completed without error       00%      6283         -
# 5  Extended offline    Completed without error       00%      6283         -
# 6  Short offline       Completed without error       00%      6283         -
# 7  Extended offline    Completed without error       00%      6262         -
# 8  Conveyance offline  Completed without error       00%      6262         -
# 9  Conveyance offline  Completed without error       00%      6262         -
#10  Extended offline    Completed without error       00%      6262         -
#11  Short offline       Completed without error       00%      6262         -
#12  Conveyance offline  Completed without error       00%      6211         -
#13  Extended offline    Completed without error       00%      6211         -
#14  Short offline       Completed without error       00%      6211         -
#15  Short offline       Completed without error       00%      6075         -
#16  Conveyance offline  Completed without error       00%      5564         -
#17  Extended offline    Completed without error       00%      5564         -
#18  Short offline       Completed without error       00%      5564         -
#19  Conveyance offline  Completed without error       00%      5319         -
#20  Short offline       Completed without error       00%      5319         -
#21  Conveyance offline  Completed without error       00%      4403         -

SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
 SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing
Selective self-test flags (0x0):
  After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.

Antwort1

Ersetzen Sie Ihre SSD

In den Kommentaren wurde viel ausprobiert, aber diese SSD scheint einige Probleme zu haben.

Den SMART-Anzeigen zufolge wurde Ihr Laufwerk nicht viel genutzt (~250 Einschaltzeiten an Tagen, ~6 TB geschrieben) und Sie sagen, es ist etwa 2 Jahre alt. Das sollte noch innerhalb der Garantiezeit liegen!

Mein Rat ist

  • Sichern Sie alle Ihre Daten sofort (obwohl Sie sagen, dass Sie das bereits erledigt haben)
  • Entfernen / Ersetzen der SSD (je nach Budget natürlich)
  • Schicken Sie die Festplatte zum Austausch an den Hersteller.

Dein "Schlankes S70" Festplatte sollte unter der 5-Jahres-Garantie vonSiliziumleistung Garantie

Schicken Sie sie einfacheine RMA-Anfrage hier.

Antwort2

Irgendwann vor dem 11. Mai 2017 haben Sie Ihre SSD-Firmware aktualisiert. Allerdings wurde eine neue Version veröffentlicht inSeptember 2017und Sie sollten es unter Windows anwenden.


Ausführen fstrim, um nicht verwendete Blöcke im Dateisystem zu verwerfen:

$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed

In meinem Fall waren die Ergebnisse für Windows 10-Partitionen /mnt/cnicht /mnt/evon dieser Welt. Also habe ich die Dateien überprüft und die Daten wurden nicht beschädigt.


Führen Sie es fsck -fauf Ihrer SSD aus, nachdem Sie mit einem Live-USB gebootet haben, wenn die Partition nicht gemountet ist. Eine andere Möglichkeit ist die Ausführung fsck -fvon Grub aus -Wie kann ich mithilfe eines bootfähigen USB-Sticks ein FSK-Test auf einer Festplatte durchführen, während diese nicht gemountet ist?.


Wie in den Kommentaren erwähnt, kann ein schlechtes SATA-Kabel Fehler verursachen.diese Antwortweist darauf hin, dass auch eine lose Verbindung Fehler verursachen kann. Um eine schlechte/lose Verbindung auszuschließen, entfernen Sie die Stecker von Ihrer SSD, blasen Sie Druckluft darüber und über die Steckerstifte am Laufwerk und setzen Sie die Kabel wieder fest ein.


Wie viel ist Ihre Zeit wert?

Die letzte Frage ist, wie viel ist Ihre Zeit wert. Angenommen, Sie haben 10 Stunden mit diesem Problem verbracht, dann beträgt das 5 USD/Stunde, da viele brandneue 120 GB SATA III SSDs beiebay.com


Update vom 23. Februar 2018

Ich habe mir heute Abend alle anderen Antworten durchgelesen. In einer Antwort steht, dass man es zurückschicken soll. Aber wenn Sie das tun und sie nichts finden, was nicht in Ordnung ist, schicken sie es einfach zurück und Sie sind zwei Wochen bis zwei Monate ohne Laufwerk.

In einer anderen Antwort heißt es, dass Smartctl meldet, dass mit dem Laufwerk alles in Ordnung ist.

In dieser Antwort habe ich das Ausführen vorgeschlagen fsck -fund Sie haben geantwortet, dass keine Fehler gemeldet wurden.

Führen Sie fsckjeden Startvorgang aus

Als Kompromiss zwischen der negativen Antwort (Gib es zurück) und der positiven Antwort (Es ist nichts falsch) würde ich dazu neigen,fsckbei jedem Booten ausführen. Wenn ein Fehler entdeckt wird, wird der Startvorgang angehalten und Sie können die Fehlermeldung lesen. Um den Link zusammenzufassen, verwenden Sie:

sudo tune2fs -c 1 /dev/sdX

Hinweis: Ersetzen Sie es Xdurch Ihren Laufwerksbuchstaben, also a, b, usw..

Wenn nach einem Monat keine Fehler auftreten, ändern Sie den Wert von 1auf 30, was meines Erachtens für die meisten Systeme typisch ist. Auf einer typischen SSD fsckläuft es schnell.

SATA-Kabel reinigen und neu einsetzen

Andere erwähnten den Austausch des SATA-Kabels, was bei einem Laptop problematisch ist. Als Kompromiss können Sie alle Kabel auf der Laufwerksseite abziehen, Druckluft auf die Stecker- und Buchsenenden auftragen und die Kabel dann wieder fest einstecken.

Antwort3

Mit Ihrem Laufwerk ist alles in Ordnung. Alle Tests verlaufen einwandfrei. Sie interpretieren die SMART-Daten einfach falsch.

Erstens enthält der erste Screenshot Rohdaten, aus denen man keine Rückschlüsse ziehen kann. Ich habe keine Ahnung, welchen Nutzen der Ersteller von diesen Daten für irgendjemanden hat, aber sie bedeuten eigentlich nichts. Es sei denn, man kann die aussagekräftigen Spalten erreichen, indem man im Fenster nach rechts scrollt oder so.

Lassen Sie mich die Spalten im SMART-Bericht (dem letzten Bericht, den Sie gepostet haben) erklären.

  • Attributname: Name der Metrik
  • Wert: aktueller Wert, höher ist besser. Werte liegen oft zwischen 100, wobei 100 = am besten ist, aber es kann jede Skala verwendet werden, solange höher besser ist. Selbst wenn die Metrik so etwas wie „Fehlerrate“ ist, ist sie normalisiert, sodass höhere Werte niedrigere Fehlerraten bedeuten.
  • Schlechter: schlechtester beobachteter Wert, höher ist besser.
  • Schwellenwert: Wenn der Wert unter diesen Wert fällt, liegt ein Fehler vor. Bei oder über diesem Wert = bestanden.
  • Typ: Was ein Fehlerzustand für diese Metrik bedeuten würde.
    • Old_age: Diese Metrik gibt einen Hinweis auf das Alter/die Nutzung des Laufwerks und nicht auf ein bestimmtes Problem.
    • Vor dem Ausfall: Diese Metrik weist auf ein potenzielles Problem mit dem Laufwerk hin und erhöht die Wahrscheinlichkeit eines Laufwerkausfalls.
  • When_failed: Wann dies den Fehlermodus eingeleitet hat, falls überhaupt
  • Raw_value: interne Messung des Laufwerks, die zum Wert beigetragen hat – dies ist für den Endbenutzer nicht nützlich und niedrigere oder höhere Werte bedeuten nicht unbedingt besser oder schlechter.

Um auf einige spezifische Bereiche des Berichts einzugehen:

Ergebnis des SMART-Selbsteinschätzungstests zum allgemeinen Gesundheitszustand: BESTANDEN

Dies spiegelt alles wider, was bestanden wurde. Keine der gemessenen Metriken hat jemals einen Fehlerzustand erreicht.

Das „Fehler“-Protokoll ist relativ typisch für ein Laufwerk. Diese weisen nicht unbedingt auf nicht behebbare Fehler oder sogar Probleme mit dem Laufwerk selbst hin; ihre Berichte sind vage, sodass Sie daraus nicht erkennen können, was tatsächlich passiert ist, außer dass es während der DMA-Übertragung am Controller passiert ist, aber wenn etwas Wichtiges passiert ist, würde es sich im Gesamtzustandsbericht widerspiegeln. Insbesondere könnten dies ziemlich harmlose Dinge sein, wie Schreibvorgänge, die am Controller abgebrochen wurden, oder das Betriebssystem, das während des Ladens eine Funktion anfordert, die das Laufwerk nicht unterstützt, was beim Prüfen der Gerätefunktionen völlig normal sein kann.

Abschließend noch ein Hinweis zu CRC-Fehlern oder Fehlerraten: Alle Laufwerke haben eine Fehlerrate. Laufwerke speichern Daten mit so hoher Dichte, dass eine bestimmte Anzahl von Bitfehlern erwartet und durch den Einsatz von Fehlerkorrekturcodes darauf ausgelegt ist. Der Fehlerkorrekturcode stellt sicher, dass eine bestimmte Anzahl von Bitfehlern pro Bitblock auftreten kann und zu 100 % korrigiert wird. Das Laufwerk wendet den Fehlerkorrekturcode ständig an und der Fehlerkorrekturcode ist so ausgelegt, dass die Wahrscheinlichkeit einesnicht wiederherstellbarBei einem gut funktionierenden Laufwerk ist die Wahrscheinlichkeit, dass zufällig Fehler auftreten, sehr gering (deutlich unwahrscheinlicher als ein Lottogewinn). Wenn Sie in einer Statistik eine Fehlerrate sehen und diese als keine große Sache behandelt wird, liegt das daran, dass dies nicht der Fall ist. Es handelt sich lediglich um korrigierte Fehler.

Antwort4

Da Sie nur WRITE-DMA-Fehler habenUndkurzUndLange Tests zeigen keine Fehler.

Und da es sich bei DMA um den direkten Speicherzugriff handelt, versuchen Sie herauszufinden, ob das BIOS über einen separaten Hardwarediagnosetest verfügt, und führen Sie die speicherbezogenen Tests durch.

Wenn kein im BIOS integrierter Test verfügbar ist, prüfen Sie auf der Support-Site des Herstellers, ob eine Offline-Hardwarediagnose verfügbar ist (z. B. bootfähige ISO-Datei zum Brennen auf CD oder USB-Stick).

(Übrigens: Eine Ubuntu-CD verfügt auch über eine Speicherdiagnose)

Da DMA-Schreiben IO ist, würde ich versuchen, das SATA-Kabel auszutauschen und zu sehen, ob danach keine neuen Fehlernummern hinzugefügt werden (die letzte ist hier 298, aber es können inzwischen weitere hinzugefügt werden).

verwandte Informationen