¿Qué significan los valores SMART actuales, peores y de umbral?

¿Qué significan los valores SMART actuales, peores y de umbral?

Tengo un disco duro interno de 2TB que podría estar fallando. Pasa varios minutos al 100% de uso cuando lo enciendo por primera vez desde que instalé Windows 10, y ayer informó una Papelera de reciclaje dañada.

Descargué CrystalDiskInfo y la información pertinente se reproduce a continuación: ingrese la descripción de la imagen aquí

En resumen, elRecuento de sectores incorregiblesEl recuento es 100 y se trata de un problema de nivel de "precaución" en la unidad. Ninguna otra etiqueta indica "precaución".

No estoy seguro de qué hacer con los valores Actual, Peor y Umbral. Sé que algunos de sus valores reales varían según el fabricante y también leí que si un valor actual está por debajo de un umbral, esa estadística ha fallado.

El valor del recuento de sectores incorregibles es 100, que también es su peor valor registrado, y la estadística tiene un umbral de cero. Además, varias otras estadísticas dicen que 100 es tanto el actual como el peor, sin estar marcado como "precaución".

¿Por qué se muestra el recuento de sectores incorregibles como precaución si otras estadísticas con el mismo valor y umbral no lo son? ¿Cómo puede ocurrir un valor inferior al umbral con un umbral cero? ¿Es esto una señal de falla inminente de la unidad o simplemente la herramienta está mal calibrada?

EDITAR:La utilidad SeaTools de Seagate informó que SMART está bien, pero no dijo nada más.

Respuesta1

¿Por qué se muestra como precaución el recuento de sectores incorregibles?

8En este caso, debe observar el valor bruto ( ). Ha habido 8 eventos.

El valor bruto de este atributo indica el número total de errores no corregibles al leer/escribir un sector.

En este caso particular, yo estaría atento al valor y, si continúa aumentando, reemplazaría el disco:

Este es un parámetro crítico. La degradación de este parámetro puede indicar una falla inminente de la unidad. Se recomienda realizar una copia de seguridad de datos urgente y reemplazar el hardware.


Atributo SMART: Recuento de sectores incorregibles

ID de atributo: 198 (0xC6)

Discos duros que admiten este atributo

Samsung, Seagate, IBM (Hitachi), Fujitsu (no todos los modelos), Maxtor, Western Digital (no todos los modelos)

Descripción

El parámetro SMART de recuento de sectores incorregibles es un parámetro crítico e indica la cantidad de errores incorregibles. El valor bruto de este atributo indica el número total de errores no corregibles al leer/escribir un sector.

Recomendaciones

Este es un parámetro crítico. La degradación de este parámetro puede indicar una falla inminente de la unidad. Se recomienda realizar una copia de seguridad de datos urgente y reemplazar el hardware.

FuenteAtributo SMART: Recuento de sectores incorregibles

Respuesta2

Para aclarar (ya que esta es una de las respuestas principales en Google para esta pregunta, pero en realidad no la responde muy bien, en mi humilde opinión):

Los valores "Actual", "Peor" y "Umbral" informados por SMART soncualitativo normalizadovalores, es decir, no indican el número real de sectores, etc. En cambio, pretenden indicar "qué tan bueno" o "qué tan malo" es el valor de esa métrica en una escala.

Con los números "Actual" y "Peor", cuanto más alto siempre es mejor, y generalmente están normalizados a alguna escala común (como 0-100). Desafortunadamente, uno de los problemas con SMART es que muchos de estos detalles no están especificados en el estándar, por lo que la escala que utiliza un fabricante en particular para estos valores depende completamente de ese fabricante. Por lo general, la mayoría de los fabricantes parecen usar 100 como máximo (por lo que los números son básicamente "porcentaje"), pero en algunos casos he visto 200, o incluso 253, etc.

Entonces, si la escala que el fabricante ha elegido es 0-100, entonces si se informa una métrica con un valor "Actual" de 100 (100% saludable), eso significa que la unidad le está diciendo "Está perfectamente bien, no hay nada de qué preocuparse aquí". ". Si informa menos que eso, entonces le indica que puede haber algún motivo de preocupación. A lo que debe prestar atención es a qué tan cerca están estos números del número de "Umbral". Si "Actual" cae por debajo del "Umbral", entonces ese es el punto en el que el fabricante considera que la unidad está "fallada" de alguna manera (y puede devolverse para devolución bajo garantía, etc.).

Pero el hecho de que el número no haya caído por debajo del umbral no significa necesariamente que todo esté bien. Puede significar que la unidad no ha fallado todavía, pero es posible que lo haga en un futuro cercano. Generalmente, cualquier valor por debajo de 100 (particularmente en ciertas métricas que han demostrado ser indicadores de posibles fallas futuras, como "recuento de sectores incorregibles") podría indicar que hay algo por lo que quizás quieras preocuparte.

Uno de los otros problemas con estos números, sin embargo, es que realmente no hay manera de saber exactamente cómo el firmware de la unidad decide la "calidad" de una situación particular. En el ejemplo dado para el "recuento de sectores incorregibles", la unidad en realidad informa un valor "actual" y "peor" de 100 ("¡todo está bien!"), pero si observamos el valor bruto, sugiere que en realidad ha habido Se encontraron 8 sectores incorregibles. ¿Son 8 sectores un problema? El impulsor no parece creerlo, pero no nos dice por qué. ¿Crees que 8 sectores son un problema? Bueno, personalmente creo que cualquier valor superior a cero para esa métrica es preocupante, así que...

Esta es la razón por la que la mayoría de la gente dirá "simplemente mire el campo de valor bruto", pero esto también tiene dos problemas: el primero es que no existe absolutamente ningún estándar sobre lo que se supone que debe devolver la unidad para ese valor, por lo que simplemente ordena de tener que adivinar lo que informa allí. Muy comúnmente, para la mayoría de las métricas que involucran "recuentos" de cosas, el valor bruto será el recuento bruto real (tenga en cuenta que los valores brutos generalmente se muestran en hexadecimal), por lo que aquí es muy probable que informe 8 sectores totales incorregibles que se han encontrado en este caso (razón por la cual CrystalDiskInfo lo marca como "precaución"). El otro problema con los valores brutos es que a menudo la unidad tiene mucha más información sobre la situación que puede tener en cuenta que solo ese valor (por ejemplo, exactamentecuandose encontró cada sector incorregible, si ha habido un número creciente recientemente, etc.), lo cual simplemente no se nos informa. Esto puede ser parte de la razón por la cual la unidad no parece preocupada por los 8 sectores defectuosos (¿quizás todos sucedieron hace mucho tiempo y no ha visto ninguno desde entonces? Pero quién sabe...)

Pero en general, para muchas de estas cosas, simplemente hay que hacer conjeturas fundamentadas. El 8 en el campo "valor bruto" probablemente significa que se han encontrado 8 sectores sin corregir (durante la vida útil de la unidad). El "100" para actual/peor dice que el firmware de la unidad en realidad no está preocupado por eso y no cree que sea realmente un problema ("100% bien"). En realidad, esto es sólo una sugerencia, por lo que su propia evaluación puede diferir.

Respuesta3

En cuanto a su primera pregunta, las tres columnas juntas le indican el estado de un atributo.

La columna "actual" significa el valor actual. Normalmente es al 100 cuando todo está bien. Los valores más altos suelen significar que el atributo nunca se ha actualizado (implica 100).

La columna "peor" le indica qué peor valor ha asignado SMART a este atributo.

"umbral" es el umbral de salud absoluto e indica el valor en o por debajo del cual SMART considera que el atributo es una falla. La mayoría de los atributos que tienen un umbral cero no son críticos. Cuando disminuyen, simplemente significa que su conducción envejece. Otros atributos tienen umbrales superiores a 0 y suelen ser críticos.

En cuanto a su segunda pregunta, el recuento de sectores incorregibles es un atributo importante que muy a menudo indica una falla total inminente. Observe este atributo muy de cerca. Si aumenta demasiado rápido, es mejor buscar una unidad de repuesto. Por lo que he visto, SMART no siempre se implementa de manera honesta. 100% salud con 8 sectores incorregibles es un caso así. Intente hacer un escaneo de superficie si desea guardar/verificar la unidad, peroAntes de realizar una operación de este tipo con una carga de E/S alta, haga una copia de seguridad..

información relacionada