Substitua seu SSD

Question 1

Substitua seu SSD

As pessoas tentaram muitas coisas nos comentários, mas este SSD parece ter alguns problemas.

A julgar pelas leituras SMART, sua unidade não teve muita ação (~250 energia por dia, ~6 TB gravados) e você diz que ela tem cerca de 2 anos. Isso deve estar dentro da garantia!

Meu conselho é

faça backup de todos os seus dados imediatamente (embora você diga que já cuidou disso)
remova/substitua o SSD (dependendo do seu orçamento, é claro)
envie o disco ao fabricante para substituição

Seu "Fino S70"o disco deve ser coberto pela garantia de 5 anos daPoder do Silício

Basta enviá-losuma solicitação de RMA aqui.

Answer

Substitua seu SSD

As pessoas tentaram muitas coisas nos comentários, mas este SSD parece ter alguns problemas.

A julgar pelas leituras SMART, sua unidade não teve muita ação (~250 energia por dia, ~6 TB gravados) e você diz que ela tem cerca de 2 anos. Isso deve estar dentro da garantia!

Meu conselho é

faça backup de todos os seus dados imediatamente (embora você diga que já cuidou disso)
remova/substitua o SSD (dependendo do seu orçamento, é claro)
envie o disco ao fabricante para substituição

Seu "Fino S70"o disco deve ser coberto pela garantia de 5 anos daPoder do Silício

Basta enviá-losuma solicitação de RMA aqui.

Question 2

Algum tempo antes de 11 de maio de 2017, você atualizou o firmware do SSD. No entanto, uma nova versão foi lançada emSetembro de 2017e você deve aplicá-lo usando o Windows.

Execute fstrimpara descartar blocos não utilizados no sistema de arquivos:

$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed

No meu caso, os resultados para partições do Windows 10 /mnt/cestavam /mnt/efora deste mundo. Então verifiquei os arquivos e nenhum dano foi causado aos dados.

Execute fsck -fem seu SSD após inicializar com um Live-USB quando a partição não estiver montada. Outra opção é executar fsck -fa partir do grub -Como fsck disco rígido enquanto o disco rígido está desmontado, usando um pendrive inicializável?.

Conforme mencionado nos comentários, um cabo SATA defeituoso pode causar erros. Mas comoesta respostaressalta, uma conexão solta também pode causar erros. Para descartar uma conexão ruim/frouxa, remova os plugues do seu SSD, sopre ar comprimido sobre eles e os pinos macho da unidade e recoloque os cabos com firmeza.

Quanto vale o seu tempo?

A última pergunta é quanto vale o seu tempo. Supondo que você gastou 10 horas neste problema, ele custará US$ 5/hora porque muitos novos SSDs SATA III de 120 GB podem ser adquiridos emebay.com

Atualização de 23 de fevereiro de 2018

Eu li todas as outras respostas esta noite. Uma resposta diz para devolvê-lo. Mas se você fizer isso e eles não encontrarem nada de errado, eles simplesmente o enviarão de volta e você ficará sem dirigir por 2 semanas a 2 meses.

Outra resposta diz que o smartctl relata que não há nada de errado com a unidade.

Nesta resposta sugeri executar fsck -fe você respondeu que nenhum erro foi relatado.

Execute `fsck`cada inicialização

Como um compromisso entre a resposta negativa (devolva) e a resposta positiva (nada está errado), minha inclinação seriaexecute fsckem cada inicialização. Se um erro for descoberto, a inicialização será pausada e você poderá ler a mensagem de erro. Para resumir o uso do link:

sudo tune2fs -c 1 /dev/sdX

Nota: substitua Xpela letra da sua unidade, ou seja, a, b, etc..

Se depois de um mês sem erros, altere o valor de 1para 30o que é típico para a maioria dos sistemas, acredito. Em um SSD típico, ele fsckserá executado rapidamente.

Limpe e recoloque os cabos SATA

Outros mencionaram a substituição do cabo SATA, que é problemático para um laptop. Como solução, considere desconectar todos os cabos do lado do inversor, usando ar comprimido nas extremidades macho e fêmea e, em seguida, reconectar os cabos com firmeza.

Answer

Algum tempo antes de 11 de maio de 2017, você atualizou o firmware do SSD. No entanto, uma nova versão foi lançada emSetembro de 2017e você deve aplicá-lo usando o Windows.

Execute fstrimpara descartar blocos não utilizados no sistema de arquivos:

$ sudo fstrim --verbose --all
/mnt/c: 16 EiB (18446744073709551615 bytes) trimmed
/mnt/e: 16 EiB (18446744073709551615 bytes) trimmed
/: 23.4 GiB (25132920832 bytes) trimmed

No meu caso, os resultados para partições do Windows 10 /mnt/cestavam /mnt/efora deste mundo. Então verifiquei os arquivos e nenhum dano foi causado aos dados.

Execute fsck -fem seu SSD após inicializar com um Live-USB quando a partição não estiver montada. Outra opção é executar fsck -fa partir do grub -Como fsck disco rígido enquanto o disco rígido está desmontado, usando um pendrive inicializável?.

Conforme mencionado nos comentários, um cabo SATA defeituoso pode causar erros. Mas comoesta respostaressalta, uma conexão solta também pode causar erros. Para descartar uma conexão ruim/frouxa, remova os plugues do seu SSD, sopre ar comprimido sobre eles e os pinos macho da unidade e recoloque os cabos com firmeza.

Quanto vale o seu tempo?

A última pergunta é quanto vale o seu tempo. Supondo que você gastou 10 horas neste problema, ele custará US$ 5/hora porque muitos novos SSDs SATA III de 120 GB podem ser adquiridos emebay.com

Atualização de 23 de fevereiro de 2018

Eu li todas as outras respostas esta noite. Uma resposta diz para devolvê-lo. Mas se você fizer isso e eles não encontrarem nada de errado, eles simplesmente o enviarão de volta e você ficará sem dirigir por 2 semanas a 2 meses.

Outra resposta diz que o smartctl relata que não há nada de errado com a unidade.

Nesta resposta sugeri executar fsck -fe você respondeu que nenhum erro foi relatado.

Execute `fsck`cada inicialização

Como um compromisso entre a resposta negativa (devolva) e a resposta positiva (nada está errado), minha inclinação seriaexecute fsckem cada inicialização. Se um erro for descoberto, a inicialização será pausada e você poderá ler a mensagem de erro. Para resumir o uso do link:

sudo tune2fs -c 1 /dev/sdX

Nota: substitua Xpela letra da sua unidade, ou seja, a, b, etc..

Se depois de um mês sem erros, altere o valor de 1para 30o que é típico para a maioria dos sistemas, acredito. Em um SSD típico, ele fsckserá executado rapidamente.

Limpe e recoloque os cabos SATA

Outros mencionaram a substituição do cabo SATA, que é problemático para um laptop. Como solução, considere desconectar todos os cabos do lado do inversor, usando ar comprimido nas extremidades macho e fêmea e, em seguida, reconectar os cabos com firmeza.

Question 3

Não há nada de errado com sua unidade. Todos os testes passam. Você está simplesmente interpretando mal os dados SMART.

Em primeiro lugar, a primeira captura de tela contém dados brutos e você não pode tirar conclusões sobre isso. Não tenho ideia da utilidade que seu criador pensa que os dados teriam para alguém, mas na verdade não significam nada. A menos que as colunas significativas possam ser alcançadas rolando para a direita na janela ou algo assim.

Deixe-me explicar as colunas do relatório SMART (o último relatório que você postou).

Nome do atributo: nome da métrica
Valor: valor atual, quanto maior melhor. Os valores geralmente vão de 100, onde 100 = melhor, mas pode-se usar qualquer escala, desde que quanto maior, melhor. Mesmo que a métrica seja algo como “taxa de erro”, ela é normalizada para que valores mais altos signifiquem taxas de erro mais baixas.
Pior: pior valor observado, quanto maior melhor.
Thresh: se o valor cair abaixo disso, é uma condição de falha. Em ou acima = aprovado.
Tipo: o que uma condição de falha significaria para esta métrica.
- Old_age: esta métrica é indicativa da idade/uso da unidade, não de um problema específico.
- Pré-falha: esta métrica é indicativa de um problema potencial com a unidade, aumentando a chance de falha da unidade.
When_failed: Quando entrou no modo de falha, se alguma vez
Raw_value: medição interna da unidade que contribuiu para o valor - não é útil para o usuário final e valores mais baixos ou mais altos não indicam necessariamente melhor ou pior.

Para abordar algumas áreas específicas do relatório:

Resultado do teste de autoavaliação de saúde geral SMART: APROVADO

Isso reflete tudo que passou. Nenhuma das métricas medidas jamais entrou em estado de falha.

O registro de “erros” é relativamente típico de uma unidade. Isso não indica necessariamente erros irrecuperáveis ou mesmo problemas com a própria unidade; seus relatórios são vagos, então você não pode dizer o que realmente aconteceu, exceto que foi durante a transferência do DMA no controlador, mas se algo fosse importante, seria refletido no relatório geral de saúde. Em particular, estes podem ser algo bastante inocente, como gravações que foram canceladas no final do controlador ou o sistema operacional solicitando algum recurso durante o carregamento que a unidade não suporta, o que pode ser totalmente normal ao testar os recursos do dispositivo.

Finalmente, uma observação sobre erros CRC ou taxas de erro: todas as unidades têm uma taxa de erro. As unidades armazenam dados em densidades tão altas que um certo número de erros de bits é esperado e projetado para isso, usando código de correção de erros. O código de correção de erros garante que um certo número de erros de bits por bloco de bits possa ocorrer e ser 100% corrigido. A unidade aplica constantemente o código de correção de erros o tempo todo, e o código de correção de erros é projetado para que a chance de umirrecuperávelo erro que ocorre aleatoriamente é muito baixo (por exemplo, significativamente menos provável do que ganhar na loteria) em uma unidade que funciona bem. Se você vir uma taxa de erro em alguma estatística e ela for tratada como se não fosse grande coisa, é porque não é, serão apenas erros corrigidos.

Answer

Não há nada de errado com sua unidade. Todos os testes passam. Você está simplesmente interpretando mal os dados SMART.

Em primeiro lugar, a primeira captura de tela contém dados brutos e você não pode tirar conclusões sobre isso. Não tenho ideia da utilidade que seu criador pensa que os dados teriam para alguém, mas na verdade não significam nada. A menos que as colunas significativas possam ser alcançadas rolando para a direita na janela ou algo assim.

Deixe-me explicar as colunas do relatório SMART (o último relatório que você postou).

Nome do atributo: nome da métrica
Valor: valor atual, quanto maior melhor. Os valores geralmente vão de 100, onde 100 = melhor, mas pode-se usar qualquer escala, desde que quanto maior, melhor. Mesmo que a métrica seja algo como “taxa de erro”, ela é normalizada para que valores mais altos signifiquem taxas de erro mais baixas.
Pior: pior valor observado, quanto maior melhor.
Thresh: se o valor cair abaixo disso, é uma condição de falha. Em ou acima = aprovado.
Tipo: o que uma condição de falha significaria para esta métrica.
- Old_age: esta métrica é indicativa da idade/uso da unidade, não de um problema específico.
- Pré-falha: esta métrica é indicativa de um problema potencial com a unidade, aumentando a chance de falha da unidade.
When_failed: Quando entrou no modo de falha, se alguma vez
Raw_value: medição interna da unidade que contribuiu para o valor - não é útil para o usuário final e valores mais baixos ou mais altos não indicam necessariamente melhor ou pior.

Para abordar algumas áreas específicas do relatório:

Resultado do teste de autoavaliação de saúde geral SMART: APROVADO

Isso reflete tudo que passou. Nenhuma das métricas medidas jamais entrou em estado de falha.

O registro de “erros” é relativamente típico de uma unidade. Isso não indica necessariamente erros irrecuperáveis ou mesmo problemas com a própria unidade; seus relatórios são vagos, então você não pode dizer o que realmente aconteceu, exceto que foi durante a transferência do DMA no controlador, mas se algo fosse importante, seria refletido no relatório geral de saúde. Em particular, estes podem ser algo bastante inocente, como gravações que foram canceladas no final do controlador ou o sistema operacional solicitando algum recurso durante o carregamento que a unidade não suporta, o que pode ser totalmente normal ao testar os recursos do dispositivo.

Finalmente, uma observação sobre erros CRC ou taxas de erro: todas as unidades têm uma taxa de erro. As unidades armazenam dados em densidades tão altas que um certo número de erros de bits é esperado e projetado para isso, usando código de correção de erros. O código de correção de erros garante que um certo número de erros de bits por bloco de bits possa ocorrer e ser 100% corrigido. A unidade aplica constantemente o código de correção de erros o tempo todo, e o código de correção de erros é projetado para que a chance de umirrecuperávelo erro que ocorre aleatoriamente é muito baixo (por exemplo, significativamente menos provável do que ganhar na loteria) em uma unidade que funciona bem. Se você vir uma taxa de erro em alguma estatística e ela for tratada como se não fosse grande coisa, é porque não é, serão apenas erros corrigidos.

Question 4

Como você tem apenas erros de WRITE DMAecurtoetestes longos não mostram erros.

E como o DMA trata do acesso direto à memória, tente descobrir se o BIOS possui um teste de diagnóstico de hardware separado e tente os testes relacionados à memória.

Se não houver um teste de BIOS incorporado disponível, consulte o site de suporte do fabricante se um diagnóstico de hardware offline estiver disponível (por exemplo: arquivo ISO inicializável para gravar em CD ou pendrive)

(BTW: Um CD do Ubuntu também possui diagnóstico de memória)

Como a gravação DMA é IO, eu tentaria substituir o cabo SATA e verificar se nenhum novo número de erro foi adicionado depois disso (o último está aqui 298, mas mais podem ser adicionados agora)

Answer

Como você tem apenas erros de WRITE DMAecurtoetestes longos não mostram erros.

E como o DMA trata do acesso direto à memória, tente descobrir se o BIOS possui um teste de diagnóstico de hardware separado e tente os testes relacionados à memória.

Se não houver um teste de BIOS incorporado disponível, consulte o site de suporte do fabricante se um diagnóstico de hardware offline estiver disponível (por exemplo: arquivo ISO inicializável para gravar em CD ou pendrive)

(BTW: Um CD do Ubuntu também possui diagnóstico de memória)

Como a gravação DMA é IO, eu tentaria substituir o cabo SATA e verificar se nenhum novo número de erro foi adicionado depois disso (o último está aqui 298, mas mais podem ser adicionados agora)

Substitua seu SSD

Responder1

Substitua seu SSD

Responder2

Quanto vale o seu tempo?

Atualização de 23 de fevereiro de 2018

Execute `fsck`cada inicialização

Limpe e recoloque os cabos SATA

Responder3

Responder4

informação relacionada

Responder1

Substitua seu SSD

Responder2

Quanto vale o seu tempo?

Atualização de 23 de fevereiro de 2018

Execute fsckcada inicialização

Limpe e recoloque os cabos SATA

Responder3

Responder4

informação relacionada

Execute `fsck`cada inicialização