Pedi para substituir tantos SSDs que não tenho vontade de pedir novamente. Mas se o SSD estiver realmente quebrado, apenas uma vez no servidor me custará US$ 500 ou algo assim.
Então, como posso ter certeza de que o SSD está realmente quebrado?
Posso apenas reformatar o disco rígido como no Windows? O disco está montado.
Antes de um pino solto, faça o servidor reiniciar muitas vezes. Parece que danificou todos os SSDs de lá.
/bin/ls: cannot access cache-zch-5666-cache.txt: Input/output error
/bin/ls: cannot access cache-zch-4970-cache.txt: Input/output error
/bin/ls: cannot access cache-zch-4782-cache.txt: Input/output error
./ cache-zch-4782-cache.txt cache-zch-5666-cache.txt
../ cache-zch-4970-cache.txt
root@host [/home2/investgr1/public_html/hello/cache/zch]# rm *
rm: cannot remove `cache-zch-4782-cache.txt': Input/output error
rm: cannot remove `cache-zch-4970-cache.txt': Input/output error
rm: cannot remove `cache-zch-5666-cache.txt': Input/output error
root@host [/home2/investgr1/public_html/hello/cache/zch]#
Responder1
Primeiro, verifique a saída dmesg
como sugeri em seupergunta anterior. Se o kernel estiver tendo problemas para se comunicar com a unidade, isso será relatado lá.
Isso não indica necessariamente que a unidade está ruim. A RAM é outro culpado popular, então faça um teste de memória. eu usoUBCDpara isso, mas existem muitas alternativas.
Se o teste de memória estiver limpo e não houver erros dmesg
, mas você ainda estiver recebendo erros de E/S, provavelmente há setores defeituosos na unidade. Para determinar isso, execute fsck -c
ou fsck -cc
no disco. O primeiro teste é melhor para SSDs, pois é um teste somente leitura, mas não consegue encontrar ou corrigir tantos problemas quanto o teste de leitura e gravação obtido com o -cc
.
Em última análise,você não pode provar uma negativa, então você nunca pode dizer “Este SSD não está quebrado” com absoluta confiança.
Para piorar o problema, é possível que um fsck
(ou badblocks
) teste não apresente erros, mas que o sintoma desapareça. Isso ocorre porque as unidades de disco regraváveis modernas possuem recursos de autorreparo que são acionados quando você pode mostrar à unidade que há um problema. Dito isto, essas instalações geralmente impedem que você veja o efeito dos setores defeituosos em primeiro lugar; portanto, se os setores defeituosos forem realmente o problema, isso pode significar que o conjunto de setores sobressalentes da unidade está esgotado.
Responder2
Execute badblocks -n -v
em uma ou mais partições. Tenho certeza de que isso não é tão significativo em um SSD (os blocos são virtuais e os SSDs fazem seu próprio gerenciamento de blocos defeituosos), mas se o dispositivo tiver problemas, o processo de badblock poderá ativá-los.
O que quer dizer que, se badblocks
encontrar blocos defeituosos em um SSD, o SSD está quebrado.
Não encontrei nenhuma referência para respaldar esta tese, mas aqui está meu raciocínio:
badblocks -n
faz um teste de leitura e gravação de baixo nível de toda a partição.- Os SSDs gerenciam seus próprios blocos defeituosos internamente e também usam o nivelamento de desgaste para distribuir o uso; os endereços dos blocos enviados ao sistema são virtuais. Portanto, nenhum desses blocos deve ter um teste ruim e, se isso acontecer, algum funcionamento da unidade falhou.
Como diz Warren Young, é difícil provar um negativo aqui, então só porque este teste foi aprovado não significa que a unidade não esteja quebrada.
Observe quevocê deve desmontar as partições primeiro, o que significa que você terá que usar um live CD ou algo assim se o seu sistema de arquivos raiz estiver no SSD.