O que significam os valores SMART atuais, piores e limites?

O que significam os valores SMART atuais, piores e limites?

Eu tenho um disco rígido interno de 2 TB que pode estar falhando. Ele gasta vários minutos com 100% de uso quando eu o ligo pela primeira vez desde que instalei o Windows 10, e ontem ele relatou uma Lixeira corrompida.

Baixei o CrystalDiskInfo e as informações pertinentes estão reproduzidas abaixo: insira a descrição da imagem aqui

Em suma, oContagem de setor incorrigívela contagem é 100 e este é um problema de nível de "cuidado" na unidade. Nenhum outro rótulo é "cuidado".

Não tenho certeza do que fazer com os valores Atual, Pior e Limite. Sei que alguns de seus valores reais variam de acordo com o fabricante e também li que, se um valor atual estiver abaixo de um limite, essa estatística falhou.

O valor da contagem de setores incorrigíveis é 100, que também é o pior valor registrado, e a estatística tem um limite de zero. Além disso, várias outras estatísticas mostram que 100 é o atual e o pior, embora não esteja marcado como "cuidado".

Por que a contagem de setores incorrigíveis está sendo exibida como alerta se várias outras estatísticas com o mesmo valor e limite não estão? Como pode ocorrer um valor inferior ao limite com um limite zero? Isso é um sinal de falha iminente da unidade ou a ferramenta está apenas mal calibrada?

EDITAR:O utilitário SeaTools da Seagate relatou que o SMART está OK, mas não disse mais nada.

Responder1

Por que a contagem de setores incorrigíveis está sendo exibida como advertência?

Você precisa observar o valor bruto ( 8) neste caso. Houve 8 eventos.

O valor bruto deste atributo indica o número total de erros incorrigíveis ao ler/escrever um setor.

Neste caso específico, eu ficaria de olho no valor e se continuar aumentando substitua a unidade:

Este é um parâmetro crítico. A degradação deste parâmetro pode indicar falha iminente da unidade. Recomenda-se backup urgente de dados e substituição de hardware.


Atributo SMART: contagem de setores incorrigível

ID do atributo: 198 (0xC6)

Discos rígidos que suportam este atributo

Samsung, Seagate, IBM (Hitachi), Fujitsu (nem todos os modelos), Maxtor, Western Digital (nem todos os modelos)

Descrição

O parâmetro SMART de contagem de setores incorrigíveis é um parâmetro crítico e indica a quantidade de erros incorrigíveis. O valor bruto deste atributo indica o número total de erros incorrigíveis ao ler/escrever um setor.

Recomendações

Este é um parâmetro crítico. A degradação deste parâmetro pode indicar falha iminente da unidade. Recomenda-se backup urgente de dados e substituição de hardware.

FonteAtributo SMART: contagem de setores incorrigível

Responder2

Para esclarecer (já que esta é uma das principais respostas do Google para esta pergunta, mas na verdade não responde muito bem, IMHO):

Os valores "Atual", "Pior" e "Limite" relatados pela SMART sãoqualitativo normalizadovalores, ou seja, não indicam o número real de setores, etc. Em vez disso, pretendem indicar "quão bom" ou "quão ruim" é o valor daquela métrica em uma escala.

Com os números "Atual" e "Pior", quanto maior é sempre melhor, e eles geralmente são normalizados para alguma escala comum (como 0-100). Infelizmente, um dos problemas do SMART é que muitos desses detalhes não são especificados no padrão; portanto, a escala que um determinado fabricante usa para esses valores depende inteiramente desse fabricante. Normalmente, a maioria dos fabricantes parece usar 100 como o máximo (então os números são basicamente "porcentagem"), mas em alguns casos já vi 200, ou mesmo 253, etc.

Portanto, se a escala escolhida pelo fabricante for de 0 a 100, se uma métrica for relatada com um valor "Atual" de 100 (100% íntegro), isso significa que a unidade está dizendo "Está perfeitamente OK, nada com que se preocupar aqui ". Se relatar menos do que isso, significa que pode haver algum motivo para preocupação. O que você deseja prestar atenção é o quão próximos esses números estão do número "Limite". Se "Atual" cair abaixo do "Limite", então esse é o ponto em que o fabricante considera que a unidade "falhou" de alguma forma (e pode ser devolvida para devolução na garantia, etc.).

Mas só porque o número não caiu abaixo do limite não significa necessariamente que tudo está ótimo. Isso pode significar que a unidade ainda não falhou, mas poderá ocorrer em um futuro próximo. Geralmente, qualquer valor abaixo de 100 (especialmente em certas métricas que demonstraram ser indicadores de possíveis falhas futuras, como "contagem de setores incorrigíveis") pode indicar que há algo com o qual você pode querer se preocupar.

Um dos outros problemas com esses números, porém, é que não há como saber exatamente como o firmware da unidade está decidindo a “qualidade” de uma situação específica. No exemplo dado para a "contagem de setores incorrigíveis", a unidade está na verdade relatando um valor "atual" e "pior" de 100 ("está tudo bem!"), mas se olharmos para o valor bruto, isso sugere que realmente houve 8 setores incorrigíveis encontrados. 8 setores são um problema? A unidade parece não pensar assim, mas não nos diz por quê. Você acha que 8 setores são um problema? Bem, eu pessoalmente acho que qualquer coisa acima de zero para essa métrica é preocupante, então...

É por isso que a maioria das pessoas dirá "basta olhar para o campo de valor bruto", mas também há dois problemas com isso: O primeiro é que não há absolutamente nenhum padrão para o que a unidade deve retornar para esse valor, então você apenas classifica de ter que adivinhar o que está relatando lá. Muito comumente, para a maioria das métricas que envolvem "contagens" de coisas, o valor bruto será a contagem bruta real (tenha em mente que os valores brutos geralmente são mostrados em hexadecimal), então aqui é bastante provável que esteja relatando 8 setores totais incorrigíveis que foram encontrados neste caso (é por isso que o CrystalDiskInfo está sinalizando isso como "cuidado"). O outro problema com valores brutos é que muitas vezes a unidade tem muito mais informações sobre a situação que pode levar em consideração do que apenas aquele valor (por exemplo, exatamentequandocada setor incorrigível foi encontrado, se houve um número crescente recentemente, etc.), o que simplesmente não nos é relatado. Isso pode ser parte do motivo pelo qual a unidade não parece preocupada com os 8 setores defeituosos (talvez todos eles tenham acontecido há muito tempo e não tenha visto nenhum desde então? Mas quem sabe...)

Mas, em geral, para muitas dessas coisas, você apenas precisa fazer suposições fundamentadas. O 8 no campo "valor bruto" provavelmente significa que foram encontrados 8 setores não corrigidos (durante a vida útil da unidade). O "100" para atual/pior indica que o firmware da unidade na verdade não está preocupado com isso e não acha que seja realmente um problema ("100% bom"). Na verdade, isso é apenas uma sugestão, portanto sua avaliação pode ser diferente.

Responder3

No que diz respeito à sua primeira pergunta, as três colunas juntas informam o status de um atributo.

A coluna "atual" significa o valor atual. Geralmente é 100 quando está tudo bem. Valores mais altos geralmente significam que o atributo nunca foi atualizado (implica 100).

A coluna “pior” informa qual o pior valor que a SMART já atribuiu a este atributo.

"limiar" é o limite absoluto de integridade e indica o valor no/abaixo do qual a SMART considera o atributo uma falha. A maioria dos atributos que possuem limite zero não são críticos. Quando eles diminuem, significa apenas que você dirige envelhecendo. Outros atributos têm limites superiores a 0 e são frequentemente críticos.

No que diz respeito à sua segunda pergunta, a contagem de setores incorrigíveis é um atributo importante que muitas vezes indica uma falha total iminente. Observe este atributo com muita atenção. Se aumentar muito rapidamente, é melhor procurar uma unidade substituta. O SMART nem sempre é implementado honestamente, pelo que tenho visto. 100% de saúde com 8 setores incorrigíveis é um desses casos. Tente fazer uma varredura de superfície se quiser salvar/verificar a unidade, masantes de fazer tal operação com alta carga de E/S, faça um backup.

informação relacionada