![Ersetzen Sie Ihre SSD](https://rvso.com/image/898942/Ersetzen%20Sie%20Ihre%20SSD.png)
Die SSD meines Laptopsist verrückt geworden und die Zahl der Fehler ist seit derdas letzte Mal, als ich gepostet habe.
Ist dieses Laufwerk tot / stirbt es?
Es ist jetzt eingeschaltet und ich schreibe dies darauf - ich habe alle meine Daten gesichert und alles, aber ich bin immer noch nicht sicher, ob es verwendbar ist oder nicht?
Die Kontaktaufnahme mit dem Hersteller hat nicht viel geholfen: Sie baten mich, Windows zu installieren und von dort aus das Dienstprogramm zur Datenträgerprüfung auszuführen oder es als externes Laufwerk an einen Windows-Host anzuschließen und es dort zu testen.
Ich habe beides getan und es sind keine Fehler aufgetreten.
Ich habe es auch mit dem von ihnen bereitgestellten Dienstprogramm überprüft (siehe Screenshot unten). Dann habe ich das mit Clonezilla erstellte Image verwendet, um zu Ubuntu zurückzukehren, und festgestellt, dass die Anzahl der SATA-PHY-Fehler bei fast 300 liegt!
Die Anschlüsse habe ich auch geprüft, da die SSD aber in einem Laptop steckt, kann ich das Kabel nicht (so einfach) wechseln.
Dies sind die Testergebnisse des Dienstprogramms des Herstellers
Und die smartctl
Ausgabe unter Ubuntu später:
smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.14.0-041400-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: SPCC Solid State Disk
Serial Number: XXXXXXXXXX
Firmware Version: S9FM02.8
User Capacity: 120,034,123,776 bytes [120 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-3 (minor revision not indicated)
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Sun Feb 18 02:22:56 2018 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 30) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 2) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000a 100 100 000 Old_age Always - 0
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 6352
12 Power_Cycle_Count 0x0012 100 100 000 Old_age Always - 2717
168 Unknown_Attribute 0x0012 100 100 000 Old_age Always - 0
170 Unknown_Attribute 0x0013 100 100 010 Pre-fail Always - 25
173 Unknown_Attribute 0x0000 100 100 000 Old_age Offline - 105447539
192 Power-Off_Retract_Count 0x0012 100 100 000 Old_age Always - 77
194 Temperature_Celsius 0x0023 070 070 000 Pre-fail Always - 30
196 Reallocated_Event_Count 0x0000 100 100 000 Old_age Offline - 0
218 Unknown_Attribute 0x0000 100 100 000 Old_age Offline - 15431
241 Total_LBAs_Written 0x0012 100 100 000 Old_age Always - 6281157
SMART Error Log Version: 1
ATA Error Count: 298 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 298 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:08.077 [VENDOR SPECIFIC]
ca 00 80 b0 8f 12 e1 00 00:11:08.076 WRITE DMA
ca 00 80 30 8f 12 e1 00 00:11:08.076 WRITE DMA
ca 00 80 b0 8e 12 e1 00 00:11:08.075 WRITE DMA
ca 00 80 30 8e 12 e1 00 00:11:08.074 WRITE DMA
Error 297 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:08.039 [VENDOR SPECIFIC]
ca 00 80 b0 7c 12 e1 00 00:11:08.038 WRITE DMA
ca 00 80 30 7c 12 e1 00 00:11:08.038 WRITE DMA
ca 00 80 b0 7b 12 e1 00 00:11:08.037 WRITE DMA
ca 00 80 30 7b 12 e1 00 00:11:08.037 WRITE DMA
Error 296 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.974 [VENDOR SPECIFIC]
ca 00 80 b0 48 12 e1 00 00:11:07.973 WRITE DMA
ca 00 80 30 48 12 e1 00 00:11:07.972 WRITE DMA
ca 00 80 b0 47 12 e1 00 00:11:07.972 WRITE DMA
ca 00 80 30 47 12 e1 00 00:11:07.972 WRITE DMA
Error 295 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.927 [VENDOR SPECIFIC]
ca 00 80 b0 2a 12 e1 00 00:11:07.926 WRITE DMA
ca 00 80 30 2a 12 e1 00 00:11:07.925 WRITE DMA
ca 00 80 b0 29 12 e1 00 00:11:07.925 WRITE DMA
ca 00 80 30 29 12 e1 00 00:11:07.924 WRITE DMA
Error 294 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.899 [VENDOR SPECIFIC]
ca 00 80 b0 22 12 e1 00 00:11:07.898 WRITE DMA
ca 00 80 30 22 12 e1 00 00:11:07.897 WRITE DMA
ca 00 80 b0 21 12 e1 00 00:11:07.897 WRITE DMA
ca 00 80 30 21 12 e1 00 00:11:07.896 WRITE DMA
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 6288 -
# 2 Conveyance offline Completed without error 00% 6285 -
# 3 Short offline Completed without error 00% 6285 -
# 4 Extended offline Completed without error 00% 6283 -
# 5 Extended offline Completed without error 00% 6283 -
# 6 Short offline Completed without error 00% 6283 -
# 7 Extended offline Completed without error 00% 6262 -
# 8 Conveyance offline Completed without error 00% 6262 -
# 9 Conveyance offline Completed without error 00% 6262 -
#10 Extended offline Completed without error 00% 6262 -
#11 Short offline Completed without error 00% 6262 -
#12 Conveyance offline Completed without error 00% 6211 -
#13 Extended offline Completed without error 00% 6211 -
#14 Short offline Completed without error 00% 6211 -
#15 Short offline Completed without error 00% 6075 -
#16 Conveyance offline Completed without error 00% 5564 -
#17 Extended offline Completed without error 00% 5564 -
#18 Short offline Completed without error 00% 5564 -
#19 Conveyance offline Completed without error 00% 5319 -
#20 Short offline Completed without error 00% 5319 -
#21 Conveyance offline Completed without error 00% 4403 -
SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Antwort1
Ersetzen Sie Ihre SSD
In den Kommentaren wurde viel ausprobiert, aber diese SSD scheint einige Probleme zu haben.
Den SMART-Anzeigen zufolge wurde Ihr Laufwerk nicht viel genutzt (~250 Einschaltzeiten an Tagen, ~6 TB geschrieben) und Sie sagen, es ist etwa 2 Jahre alt. Das sollte noch innerhalb der Garantiezeit liegen!
Mein Rat ist
- Sichern Sie alle Ihre Daten sofort (obwohl Sie sagen, dass Sie das bereits erledigt haben)
- Entfernen / Ersetzen der SSD (je nach Budget natürlich)
- Schicken Sie die Festplatte zum Austausch an den Hersteller.
Dein "Schlankes S70" Festplatte sollte unter der 5-Jahres-Garantie vonSiliziumleistung
Schicken Sie sie einfacheine RMA-Anfrage hier.
Antwort2
Irgendwann vor dem 11. Mai 2017 haben Sie Ihre SSD-Firmware aktualisiert. Allerdings wurde eine neue Version veröffentlicht inSeptember 2017und Sie sollten es unter Windows anwenden.
Ausführen fstrim
, um nicht verwendete Blöcke im Dateisystem zu verwerfen:
$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed
In meinem Fall waren die Ergebnisse für Windows 10-Partitionen /mnt/c
nicht /mnt/e
von dieser Welt. Also habe ich die Dateien überprüft und die Daten wurden nicht beschädigt.
Führen Sie es fsck -f
auf Ihrer SSD aus, nachdem Sie mit einem Live-USB gebootet haben, wenn die Partition nicht gemountet ist. Eine andere Möglichkeit ist die Ausführung fsck -f
von Grub aus -Wie kann ich mithilfe eines bootfähigen USB-Sticks ein FSK-Test auf einer Festplatte durchführen, während diese nicht gemountet ist?.
Wie in den Kommentaren erwähnt, kann ein schlechtes SATA-Kabel Fehler verursachen.diese Antwortweist darauf hin, dass auch eine lose Verbindung Fehler verursachen kann. Um eine schlechte/lose Verbindung auszuschließen, entfernen Sie die Stecker von Ihrer SSD, blasen Sie Druckluft darüber und über die Steckerstifte am Laufwerk und setzen Sie die Kabel wieder fest ein.
Wie viel ist Ihre Zeit wert?
Die letzte Frage ist, wie viel ist Ihre Zeit wert. Angenommen, Sie haben 10 Stunden mit diesem Problem verbracht, dann beträgt das 5 USD/Stunde, da viele brandneue 120 GB SATA III SSDs beiebay.com
Update vom 23. Februar 2018
Ich habe mir heute Abend alle anderen Antworten durchgelesen. In einer Antwort steht, dass man es zurückschicken soll. Aber wenn Sie das tun und sie nichts finden, was nicht in Ordnung ist, schicken sie es einfach zurück und Sie sind zwei Wochen bis zwei Monate ohne Laufwerk.
In einer anderen Antwort heißt es, dass Smartctl meldet, dass mit dem Laufwerk alles in Ordnung ist.
In dieser Antwort habe ich das Ausführen vorgeschlagen fsck -f
und Sie haben geantwortet, dass keine Fehler gemeldet wurden.
Führen Sie fsck
jeden Startvorgang aus
Als Kompromiss zwischen der negativen Antwort (Gib es zurück) und der positiven Antwort (Es ist nichts falsch) würde ich dazu neigen,fsck
bei jedem Booten ausführen. Wenn ein Fehler entdeckt wird, wird der Startvorgang angehalten und Sie können die Fehlermeldung lesen. Um den Link zusammenzufassen, verwenden Sie:
sudo tune2fs -c 1 /dev/sdX
Hinweis: Ersetzen Sie es X
durch Ihren Laufwerksbuchstaben, also a
, b
, usw..
Wenn nach einem Monat keine Fehler auftreten, ändern Sie den Wert von 1
auf 30
, was meines Erachtens für die meisten Systeme typisch ist. Auf einer typischen SSD fsck
läuft es schnell.
SATA-Kabel reinigen und neu einsetzen
Andere erwähnten den Austausch des SATA-Kabels, was bei einem Laptop problematisch ist. Als Kompromiss können Sie alle Kabel auf der Laufwerksseite abziehen, Druckluft auf die Stecker- und Buchsenenden auftragen und die Kabel dann wieder fest einstecken.
Antwort3
Mit Ihrem Laufwerk ist alles in Ordnung. Alle Tests verlaufen einwandfrei. Sie interpretieren die SMART-Daten einfach falsch.
Erstens enthält der erste Screenshot Rohdaten, aus denen man keine Rückschlüsse ziehen kann. Ich habe keine Ahnung, welchen Nutzen der Ersteller von diesen Daten für irgendjemanden hat, aber sie bedeuten eigentlich nichts. Es sei denn, man kann die aussagekräftigen Spalten erreichen, indem man im Fenster nach rechts scrollt oder so.
Lassen Sie mich die Spalten im SMART-Bericht (dem letzten Bericht, den Sie gepostet haben) erklären.
- Attributname: Name der Metrik
- Wert: aktueller Wert, höher ist besser. Werte liegen oft zwischen 100, wobei 100 = am besten ist, aber es kann jede Skala verwendet werden, solange höher besser ist. Selbst wenn die Metrik so etwas wie „Fehlerrate“ ist, ist sie normalisiert, sodass höhere Werte niedrigere Fehlerraten bedeuten.
- Schlechter: schlechtester beobachteter Wert, höher ist besser.
- Schwellenwert: Wenn der Wert unter diesen Wert fällt, liegt ein Fehler vor. Bei oder über diesem Wert = bestanden.
- Typ: Was ein Fehlerzustand für diese Metrik bedeuten würde.
- Old_age: Diese Metrik gibt einen Hinweis auf das Alter/die Nutzung des Laufwerks und nicht auf ein bestimmtes Problem.
- Vor dem Ausfall: Diese Metrik weist auf ein potenzielles Problem mit dem Laufwerk hin und erhöht die Wahrscheinlichkeit eines Laufwerkausfalls.
- When_failed: Wann dies den Fehlermodus eingeleitet hat, falls überhaupt
- Raw_value: interne Messung des Laufwerks, die zum Wert beigetragen hat – dies ist für den Endbenutzer nicht nützlich und niedrigere oder höhere Werte bedeuten nicht unbedingt besser oder schlechter.
Um auf einige spezifische Bereiche des Berichts einzugehen:
Ergebnis des SMART-Selbsteinschätzungstests zum allgemeinen Gesundheitszustand: BESTANDEN
Dies spiegelt alles wider, was bestanden wurde. Keine der gemessenen Metriken hat jemals einen Fehlerzustand erreicht.
Das „Fehler“-Protokoll ist relativ typisch für ein Laufwerk. Diese weisen nicht unbedingt auf nicht behebbare Fehler oder sogar Probleme mit dem Laufwerk selbst hin; ihre Berichte sind vage, sodass Sie daraus nicht erkennen können, was tatsächlich passiert ist, außer dass es während der DMA-Übertragung am Controller passiert ist, aber wenn etwas Wichtiges passiert ist, würde es sich im Gesamtzustandsbericht widerspiegeln. Insbesondere könnten dies ziemlich harmlose Dinge sein, wie Schreibvorgänge, die am Controller abgebrochen wurden, oder das Betriebssystem, das während des Ladens eine Funktion anfordert, die das Laufwerk nicht unterstützt, was beim Prüfen der Gerätefunktionen völlig normal sein kann.
Abschließend noch ein Hinweis zu CRC-Fehlern oder Fehlerraten: Alle Laufwerke haben eine Fehlerrate. Laufwerke speichern Daten mit so hoher Dichte, dass eine bestimmte Anzahl von Bitfehlern erwartet und durch den Einsatz von Fehlerkorrekturcodes darauf ausgelegt ist. Der Fehlerkorrekturcode stellt sicher, dass eine bestimmte Anzahl von Bitfehlern pro Bitblock auftreten kann und zu 100 % korrigiert wird. Das Laufwerk wendet den Fehlerkorrekturcode ständig an und der Fehlerkorrekturcode ist so ausgelegt, dass die Wahrscheinlichkeit einesnicht wiederherstellbarBei einem gut funktionierenden Laufwerk ist die Wahrscheinlichkeit, dass zufällig Fehler auftreten, sehr gering (deutlich unwahrscheinlicher als ein Lottogewinn). Wenn Sie in einer Statistik eine Fehlerrate sehen und diese als keine große Sache behandelt wird, liegt das daran, dass dies nicht der Fall ist. Es handelt sich lediglich um korrigierte Fehler.
Antwort4
Da Sie nur WRITE-DMA-Fehler habenUndkurzUndLange Tests zeigen keine Fehler.
Und da es sich bei DMA um den direkten Speicherzugriff handelt, versuchen Sie herauszufinden, ob das BIOS über einen separaten Hardwarediagnosetest verfügt, und führen Sie die speicherbezogenen Tests durch.
Wenn kein im BIOS integrierter Test verfügbar ist, prüfen Sie auf der Support-Site des Herstellers, ob eine Offline-Hardwarediagnose verfügbar ist (z. B. bootfähige ISO-Datei zum Brennen auf CD oder USB-Stick).
(Übrigens: Eine Ubuntu-CD verfügt auch über eine Speicherdiagnose)
Da DMA-Schreiben IO ist, würde ich versuchen, das SATA-Kabel auszutauschen und zu sehen, ob danach keine neuen Fehlernummern hinzugefügt werden (die letzte ist hier 298, aber es können inzwischen weitere hinzugefügt werden).