¿Cómo interpretar los atributos SMART?

¿Cómo interpretar los atributos SMART?

Quiero estimar el estado y la vida útil restante de mi disco duro usando SMART (en mi caso gsmartcontrol). Sin embargo, no sé cómo interpretar los atributos. Más específicamente:

  • ¿Qué atributos son más importantes para estas estimaciones?
  • cómo interpretar los valores sin procesar: qué tan altos o bajos se permiten los valores sin procesar para un disco duro determinado (por ejemplo, en mi caso, un WD scorpio black)
  • ¿Existe alguna tabla del fabricante donde pueda comparar los valores actuales con algunos límites?

¿Cómo interpretaría los valores brutos actuales de mi WD scorpio black como se muestran a continuación en relación con la salud y la vida útil restante? (Utilizo el disco desde hace 3 años de forma regular, no voy a cambiar el patrón de uso).

Elegante

Respuesta1

Primero, esto es lo que puedo decirle sobre el estado de su disco:

  • Su disco duro no tiene signos de falla inminente(0 sectores reasignados/pendientes, no hay problemas al girar, con el cable SATA, etc. y los atributos "malos, pero no letales" son en su mayoría 0)
  • Su computadora portátil ha recibido una buena cantidad de golpes mientras estaba en funcionamiento.(G-Sense + Protección contra caída libre son bastante altos)
  • Su disco duro funciona a una temperatura bastante promedio para el disco de una computadora portátil (aunque esto depende de la carga que tenía cuando realizó este informe).

Algunas investigaciones realizadas por Google indican que es más probable que las unidades fallen en los primeros 6 meses, especialmente si se utilizan mucho. Dado que su unidad ha sobrevivido 3 años sin signos de falla, es probable que continúe funcionando bien. Eso no significa que no debas mantener copias de seguridad, por si acaso ;-)

Además, trate de evitar golpear su computadora portátil mientras está encendida y trate de evitar levantarla hasta que esté apagada; esto podría tener algo que ver con los altos recuentos de errores de protección contra caída libre y G-Sense de su unidad. Su unidad tiene capacidades de detección de impactos (algunas unidades no las tienen y siempre informarán 0 incluso si se sacuden mientras están en funcionamiento), por lo que intentará estacionar los cabezales de la unidad cuando detecte movimiento. Obviamente, no ha matado el disco, pero un golpe particularmente fuerte en el momento equivocado podría hacerlo, por lo que intentará estacionar los cabezales del disco cuando detecte movimiento, lo que hará que los cabezales del disco golpeen y dañen los platos.

Y algunas curiosidades y conjeturas:

  • Tiene bastante movilidad con su computadora portátil y probablemente la use mucho mientras viaja(debido a la cantidad considerable de recuentos de G-Sense y protección contra caídas libres; estos estarían cerca de 0 para una computadora portátil utilizada en un escritorio y apagada mientras se mueve)
  • Su computadora portátil está encendida al menos un tercio del tiempo(Horas de encendido = un año de uso continuo, usted dice que la unidad tiene 3 años)
  • Enciendes y apagas tu computadora portátil varias veces al día.(basado en el recuento de ciclos de energía en comparación con la antigüedad de la unidad)
  • Su computadora portátil no parece tener todas las opciones de ahorro de energía activadas(basado en el ciclo de carga/descarga comparado con el recuento de ciclos de energía y las horas de vuelo principales en comparación con las horas de encendido)
  • Su disco duro ha escrito aproximadamente 120 TB de datos y ha leído 866 TB de datos.(basado en el total de LBA escritos y leídos)

¿Qué atributos son los más importantes?

El atributo más importante en términos de tasas de fracaso es el recuento de sectores reasignados. Si es un número mayor que 0, entonces su unidad tiene muchas más probabilidades de fallar. El otro atributo importante es el recuento de sectores pendientes actuales (estos luego pueden convertirse en sectores reasignados). Si alguno de estos es superior a 1, deberá reemplazar la unidad lo antes posible. (fuente: trabajo de investigación de Google)

Un recuento de errores UDMA CRC particularmente malo puede indicar que es necesario reemplazar el cable SATA. (fuente: experiencia personal)

Cómo interpretar los valores brutos

Los valores brutos difieren de un fabricante a otro. En el caso de Western Digital, la mayoría de los números tienden a ser la frecuencia con la que se ha producido la condición específica. Las unidades Seagate almacenan algunos de los números de forma diferente, lo que da como resultado valores brutos muy altos para algunos atributos. Dado esto, para muchos valores (aparte del recuento de sectores reasignados y el recuento pendiente y otros valores brutos de recuento obvios) tiene más sentido observar el valor normalizado: la unidad genera los valores normalizados, no el programa. entonces es lo que el disco considera normal.

¿Existe alguna tabla del fabricante donde pueda comparar los valores actuales con algunos límites?

Generalmente, si el valor normalizado (o peor) de un atributo alcanza elumbral o inferior,entonces el viaje está tostado. (Los valores normalizados empeoran a medida que se acercan a cero).

Los discos duros también tienen hojas de especificaciones, que enumeran para cuántos ciclos de inicio/parada está clasificado un disco, entre otras cosas.

Respuesta2

Bien, sé que este tema es bastante antiguo, pero aquí mis pensamientos:

Horas de vuelo del cabezal 40858023897390 => A HEX: 0x2529 0000 292E

4 bytes más bajos 0x292E = 10,541 horas de encendido (como se ve a continuación)

4 bytes más altos 0x2529 = ??? (¿Quizás milisegundos? El número sube y baja sin cambiar de hora, tal vez esté en complemento binario a dos o no tenga ninguna relación con el tiempo)

y sobre Total LBAs r/w... parece ser exactamente eso.

Información de SMART para Disco 1
SEAGATE 2 TB

Modelo:     ST2000DM001-1CH164
Número de serie:    Z1E5716J
Firmware:   CC27

Atributo SMART

Tiempo de giro  0
Contador de inicio/parada   32
Contador de sectores recolocados    0
Horas de encendido         10541   (POWER ON HOURS)
Contador de reintento de giro   0
Contador de reinicio    32
Runtime Bad Block   1
End-to-End Error    0
Reported Uncorrect  0
Command Timeout 0
High Fly Writes 3
Airflow Temperature Cel 41
G-Sense Error Rate  0
Contador de retracción de apagado   20
Contador de ciclo de carga  32
Temperatura en grados Celsius   41
Sector actualmente pendiente    0
No corregibles sin conexión 0
Contador de error CRC de UDMA   0
Head Flying Hours   40858023897390
Total LBAs Written  93750333994
Total LBAs Read 69405426987
Contador de errores ATA 0

información relacionada