![Reemplace su SSD](https://rvso.com/image/898942/Reemplace%20su%20SSD.png)
SSD de mi portátilestá funcionando mal y el número de errores se ha disparado desde ella última vez que publiqué.
¿Este disco está muerto/moribundo?
Está encendido ahora y estoy escribiendo esto en él: tengo una copia de seguridad de todos mis datos y todo, pero todavía no estoy seguro de si se puede utilizar o no.
Contactar al fabricante no ayudó mucho: me pidieron que instalara Windows y ejecutara la utilidad de verificación de disco desde allí o que lo conectara como una unidad externa a un host de Windows y lo probara allí.
Hice ambas cosas y no encontré ningún error.
También lo verifiqué con la utilidad que proporcionan (ver captura de pantalla a continuación). Luego usé la imagen que hice con clonezilla para regresar a Ubuntu y descubrí que el recuento de errores SATA PHY se acerca a los 300 errores.
También revisé los conectores, pero como el SSD está en una computadora portátil, no puedo cambiar el cable (fácilmente).
Estos son los resultados de las pruebas generados por la utilidad del fabricante.
Y el smartctl
resultado en Ubuntu, más adelante:
smartctl 6.5 2016-05-07 r4318 [x86_64-linux-4.14.0-041400-generic] (local build)
Copyright (C) 2002-16, Bruce Allen, Christian Franke, www.smartmontools.org
=== START OF INFORMATION SECTION ===
Device Model: SPCC Solid State Disk
Serial Number: XXXXXXXXXX
Firmware Version: S9FM02.8
User Capacity: 120,034,123,776 bytes [120 GB]
Sector Size: 512 bytes logical/physical
Rotation Rate: Solid State Device
Form Factor: 2.5 inches
Device is: Not in smartctl database [for details use: -P showall]
ATA Version is: ACS-3 (minor revision not indicated)
SATA Version is: SATA 3.1, 6.0 Gb/s (current: 3.0 Gb/s)
Local Time is: Sun Feb 18 02:22:56 2018 EET
SMART support is: Available - device has SMART capability.
SMART support is: Enabled
=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
General SMART Values:
Offline data collection status: (0x00) Offline data collection activity
was never started.
Auto Offline Data Collection: Disabled.
Self-test execution status: ( 0) The previous self-test routine completed
without error or no self-test has ever
been run.
Total time to complete Offline
data collection: ( 30) seconds.
Offline data collection
capabilities: (0x7b) SMART execute Offline immediate.
Auto Offline data collection on/off support.
Suspend Offline collection upon new
command.
Offline surface scan supported.
Self-test supported.
Conveyance Self-test supported.
Selective Self-test supported.
SMART capabilities: (0x0003) Saves SMART data before entering
power-saving mode.
Supports SMART auto save timer.
Error logging capability: (0x01) Error logging supported.
General Purpose Logging supported.
Short self-test routine
recommended polling time: ( 1) minutes.
Extended self-test routine
recommended polling time: ( 2) minutes.
Conveyance self-test routine
recommended polling time: ( 2) minutes.
SMART Attributes Data Structure revision number: 16
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME FLAG VALUE WORST THRESH TYPE UPDATED WHEN_FAILED RAW_VALUE
1 Raw_Read_Error_Rate 0x000a 100 100 000 Old_age Always - 0
9 Power_On_Hours 0x0012 100 100 000 Old_age Always - 6352
12 Power_Cycle_Count 0x0012 100 100 000 Old_age Always - 2717
168 Unknown_Attribute 0x0012 100 100 000 Old_age Always - 0
170 Unknown_Attribute 0x0013 100 100 010 Pre-fail Always - 25
173 Unknown_Attribute 0x0000 100 100 000 Old_age Offline - 105447539
192 Power-Off_Retract_Count 0x0012 100 100 000 Old_age Always - 77
194 Temperature_Celsius 0x0023 070 070 000 Pre-fail Always - 30
196 Reallocated_Event_Count 0x0000 100 100 000 Old_age Offline - 0
218 Unknown_Attribute 0x0000 100 100 000 Old_age Offline - 15431
241 Total_LBAs_Written 0x0012 100 100 000 Old_age Always - 6281157
SMART Error Log Version: 1
ATA Error Count: 298 (device log contains only the most recent five errors)
CR = Command Register [HEX]
FR = Features Register [HEX]
SC = Sector Count Register [HEX]
SN = Sector Number Register [HEX]
CL = Cylinder Low Register [HEX]
CH = Cylinder High Register [HEX]
DH = Device/Head Register [HEX]
DC = Device Command Register [HEX]
ER = Error register [HEX]
ST = Status register [HEX]
Powered_Up_Time is measured from power on, and printed as
DDd+hh:mm:SS.sss where DD=days, hh=hours, mm=minutes,
SS=sec, and sss=millisec. It "wraps" after 49.710 days.
Error 298 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:08.077 [VENDOR SPECIFIC]
ca 00 80 b0 8f 12 e1 00 00:11:08.076 WRITE DMA
ca 00 80 30 8f 12 e1 00 00:11:08.076 WRITE DMA
ca 00 80 b0 8e 12 e1 00 00:11:08.075 WRITE DMA
ca 00 80 30 8e 12 e1 00 00:11:08.074 WRITE DMA
Error 297 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:08.039 [VENDOR SPECIFIC]
ca 00 80 b0 7c 12 e1 00 00:11:08.038 WRITE DMA
ca 00 80 30 7c 12 e1 00 00:11:08.038 WRITE DMA
ca 00 80 b0 7b 12 e1 00 00:11:08.037 WRITE DMA
ca 00 80 30 7b 12 e1 00 00:11:08.037 WRITE DMA
Error 296 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.974 [VENDOR SPECIFIC]
ca 00 80 b0 48 12 e1 00 00:11:07.973 WRITE DMA
ca 00 80 30 48 12 e1 00 00:11:07.972 WRITE DMA
ca 00 80 b0 47 12 e1 00 00:11:07.972 WRITE DMA
ca 00 80 30 47 12 e1 00 00:11:07.972 WRITE DMA
Error 295 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.927 [VENDOR SPECIFIC]
ca 00 80 b0 2a 12 e1 00 00:11:07.926 WRITE DMA
ca 00 80 30 2a 12 e1 00 00:11:07.925 WRITE DMA
ca 00 80 b0 29 12 e1 00 00:11:07.925 WRITE DMA
ca 00 80 30 29 12 e1 00 00:11:07.924 WRITE DMA
Error 294 occurred at disk power-on lifetime: 0 hours (0 days + 0 hours)
When the command that caused the error occurred, the device was active or idle.
After command completion occurred, registers were:
ER ST SC SN CL CH DH
-- -- -- -- -- -- --
84 51 01 01 00 00 00
Commands leading to the command that caused the error were:
CR FR SC SN CL CH DH DC Powered_Up_Time Command/Feature_Name
-- -- -- -- -- -- -- -- ---------------- --------------------
ff d5 01 01 00 00 00 ff 00:11:07.899 [VENDOR SPECIFIC]
ca 00 80 b0 22 12 e1 00 00:11:07.898 WRITE DMA
ca 00 80 30 22 12 e1 00 00:11:07.897 WRITE DMA
ca 00 80 b0 21 12 e1 00 00:11:07.897 WRITE DMA
ca 00 80 30 21 12 e1 00 00:11:07.896 WRITE DMA
SMART Self-test log structure revision number 1
Num Test_Description Status Remaining LifeTime(hours) LBA_of_first_error
# 1 Short offline Completed without error 00% 6288 -
# 2 Conveyance offline Completed without error 00% 6285 -
# 3 Short offline Completed without error 00% 6285 -
# 4 Extended offline Completed without error 00% 6283 -
# 5 Extended offline Completed without error 00% 6283 -
# 6 Short offline Completed without error 00% 6283 -
# 7 Extended offline Completed without error 00% 6262 -
# 8 Conveyance offline Completed without error 00% 6262 -
# 9 Conveyance offline Completed without error 00% 6262 -
#10 Extended offline Completed without error 00% 6262 -
#11 Short offline Completed without error 00% 6262 -
#12 Conveyance offline Completed without error 00% 6211 -
#13 Extended offline Completed without error 00% 6211 -
#14 Short offline Completed without error 00% 6211 -
#15 Short offline Completed without error 00% 6075 -
#16 Conveyance offline Completed without error 00% 5564 -
#17 Extended offline Completed without error 00% 5564 -
#18 Short offline Completed without error 00% 5564 -
#19 Conveyance offline Completed without error 00% 5319 -
#20 Short offline Completed without error 00% 5319 -
#21 Conveyance offline Completed without error 00% 4403 -
SMART Selective self-test log data structure revision number 0
Note: revision number not 1 implies that no selective self-test has ever been run
SPAN MIN_LBA MAX_LBA CURRENT_TEST_STATUS
1 0 0 Not_testing
2 0 0 Not_testing
3 0 0 Not_testing
4 0 0 Not_testing
5 0 0 Not_testing
Selective self-test flags (0x0):
After scanning selected spans, do NOT read-scan remainder of disk.
If Selective self-test is pending on power-up, resume after 0 minute delay.
Respuesta1
Reemplace su SSD
La gente ha probado muchas cosas en los comentarios, pero este SSD parece tener algunos problemas.
A juzgar por las lecturas SMART, su unidad no ha visto mucha acción (~250 de energía por día, ~6 TB escritos) y usted dice que tiene aproximadamente 2 años. ¡Esto debería estar dentro de la garantía!
Mi consejo es
- haga una copia de seguridad de todos sus datos inmediatamente (aunque dice que ya lo tiene cubierto)
- quitar/reemplazar el SSD (dependiendo de tu presupuesto, por supuesto)
- enviar el disco al fabricante para su reemplazo
Su "Delgado S70"El disco debe estar cubierto por la garantía de 5 años dePoder de silicio
solo envíalosuna solicitud de RMA aquí.
Respuesta2
En algún momento antes del 11 de mayo de 2017, actualizó el firmware de su SSD. Sin embargo, se lanzó una nueva versión enseptiembre 2017y deberías aplicarlo usando Windows.
Ejecute fstrim
para descartar los bloques no utilizados en el sistema de archivos:
$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed
En mi caso, los resultados para las particiones de Windows 10 /mnt/c
estaban /mnt/e
fuera de este mundo. Así que verifiqué los archivos y no se dañaron los datos.
Ejecútelo fsck -f
en su SSD después de iniciar con un Live-USB cuando la partición no esté montada. Otra opción es ejecutar fsck -f
desde grub.¿Cómo fsck del disco duro mientras el disco duro está desmontado, usando una memoria USB de arranque?.
Como se mencionó en los comentarios, un cable SATA defectuoso puede causar errores. Pero comoesta respuestaComo señala, una conexión floja también puede causar errores. Para descartar una conexión defectuosa o floja, retire los enchufes de su SSD, sople aire comprimido sobre ellos y las clavijas macho de la unidad y vuelva a asentar firmemente los cables.
¿Cuánto vale su tiempo?
La última pregunta es cuánto vale tu tiempo. Suponiendo que haya dedicado 10 horas a este problema, equivale a $ 5 por hora porque se pueden comprar muchos SSD SATA III de 120 GB nuevos enebay.com
Actualización del 23 de febrero de 2018
Leí todas las demás respuestas esta noche. Una respuesta dice que lo devuelva. Pero si lo hace y no encuentran nada malo, simplemente lo devolverán y usted estará sin conducir durante 2 semanas a 2 meses.
Otra respuesta dice que smartctl informa que no hay ningún problema con la unidad.
En esta respuesta sugerí ejecutar fsck -f
y usted respondió que no se informaron errores.
Ejecute fsck
cada arranque
Como compromiso entre la respuesta negativa (devolverla) y la respuesta positiva (no pasa nada), me inclinaría aejecutar fsck
en cada arranque. Si se descubre un error, el inicio se pausa y podrá leer el mensaje de error. Para resumir el uso del enlace:
sudo tune2fs -c 1 /dev/sdX
Nota: reemplácela X
con la letra de su unidad, es decir a
, b
, etc..
Si después de un mes no hay errores, cambie el valor de 1
a 30
que creo que es típico para la mayoría de los sistemas. En un SSD típico, se fsck
ejecutará rápidamente.
Limpiar y volver a colocar los cables SATA.
Otros mencionaron reemplazar el cable SATA, lo cual es problemático para una computadora portátil. Como solución intermedia, considere desconectar todos los cables del lado del variador, usar aire comprimido en los extremos macho y hembra y luego volver a enchufar los cables firmemente.
Respuesta3
No hay nada malo con tu disco. Todas las pruebas pasan. Simplemente está malinterpretando los datos SMART.
En primer lugar, la primera captura de pantalla contiene datos sin procesar y no se pueden sacar conclusiones al respecto. No tengo idea de qué utilidad cree su creador que serían los datos para nadie, pero en realidad no significa nada. A menos que se pueda acceder a las columnas significativas desplazándose hacia la derecha en la ventana o algo así.
Permítanme explicarles las columnas del informe SMART (el último informe que publicó).
- Nombre del atributo: nombre de la métrica
- Valor: valor actual, cuanto más alto, mejor. Los valores suelen estar sobre 100, donde 100 = mejor, pero se puede utilizar cualquier escala siempre que cuanto más alto sea mejor. Incluso si la métrica es algo así como "tasa de error", está normalizada, por lo que valores más altos significan tasas de error más bajas.
- Peor: peor valor observado, cuanto más alto, mejor.
- Umbral: si el valor cae por debajo de este, es una condición de falla. En o por encima = aprobado.
- Tipo: qué significaría una condición de error para esta métrica.
- Old_age: esta métrica es indicativa de la antigüedad/uso de la unidad, no de un problema específico.
- Pre-fallo: esta métrica es indicativa de un problema potencial con la unidad, lo que aumenta la posibilidad de que falle la unidad.
- When_failed: Cuando esto entró en modo de falla, si alguna vez
- Raw_value: medición interna de la unidad que contribuyó al valor; esto no es útil para el usuario final y los valores más bajos o más altos no necesariamente indican mejor o peor.
Para abordar algunas áreas específicas del informe:
Resultado de la prueba de autoevaluación de salud general SMART: APROBADO
Esto refleja todo lo pasado. Ninguna de las métricas medidas ha entrado nunca en estado de falla.
El registro de "errores" es relativamente típico de una unidad. Estos no necesariamente indican errores irrecuperables o incluso problemas con la propia unidad; sus informes son vagos, por lo que no se puede saber qué sucedió realmente a partir de esto, excepto que fue durante la transferencia de DMA en el controlador, pero si algo fuera importante se reflejaría en el informe de estado general. En particular, estos podrían ser algo bastante inocente como escrituras que se cancelaron en el extremo del controlador o que el sistema operativo solicite alguna función durante la carga que la unidad no admite, lo que puede ser completamente normal al probar las capacidades del dispositivo.
Finalmente, una nota sobre los errores CRC o las tasas de error: todas las unidades tienen una tasa de error. Las unidades almacenan datos a densidades tan altas que se espera y está diseñado para una cierta cantidad de errores de bits, mediante el uso de código de corrección de errores. El código de corrección de errores garantiza que pueda ocurrir una cierta cantidad de errores de bits por fragmento de bits y que se corrijan al 100%. La unidad aplica constantemente el código de corrección de errores todo el tiempo y el código de corrección de errores está diseñado para que la posibilidad de que se produzca unirrecuperableEl error que ocurre aleatoriamente es muy bajo (es decir, significativamente menos probable que ganar la lotería) en una unidad que funciona bien. Si ve una tasa de error en alguna estadística y se trata como si no fuera gran cosa, es porque no lo es, simplemente serán errores corregidos.
Respuesta4
Ya que solo tienes errores de ESCRITURA DMAycortoyLas pruebas largas no muestran errores.
Y dado que DMA se trata del acceso directo a la memoria, intente averiguar si el BIOS tiene una prueba de diagnóstico de hardware separada y pruebe las pruebas relacionadas con la memoria.
Si no hay una prueba integrada de BIOS disponible, consulte el sitio de soporte del fabricante si hay disponible un diagnóstico de hardware fuera de línea (por ejemplo: archivo ISO de arranque para grabar en CD o memoria USB)
(Por cierto: un CD de Ubuntu también tiene diagnósticos de memoria)
Debido a que la escritura DMA es IO, intentaría reemplazar el cable SATA y ver si no se agregan nuevos números de error después de eso (el último está aquí, 298, pero ahora se pueden agregar más)