Corrupção de dados na memória detectada: onde está o problema?

Corrupção de dados na memória detectada: onde está o problema?

Estamos enfrentando travamentos em nossos SSD VPSes, todos funcionando em KVM: travamentos ocorrem por diferentes motivos; na pressa de restaurar o serviço que minha equipe usa para recarregar um snapshot anterior da máquina e nunca salva os logs.

De qualquer forma, entre todas as diferentes circunstâncias de travamentos, um fato recorrente é o seguinte corruption of in-memory data: nosso provedor de VPS nos disse que seu hardware está funcionando bem, mas não sei como ler o registro ruim que recebi.

insira a descrição da imagem aqui

O que está envolvido quando uma “corrupção de dados na memória” é detectada?Poderia ser por causa de RAM quebrada ou há outros tipos de corrupção de memória?

O engraçado: um provedor VPS usando VMware nunca nos deu problemas, aquele que usa KVM está realmente nos deixando loucos por causa desses travamentos.

Editar 1: Eu, de forma alguma, exijo que vocês deduzam a solução deste registro miserável. Estou preso a esse problema em que nenhum log decente é fornecido, memtesté inútil, pois o hardware é emulado e o provedor VPS garante que seu hardware está bom e nenhuma instância de KVM ou QEMU travou. corruption of in-memory data detectedestá me assombrando e não consigo pensar em nenhuma abordagem produtiva para investigar mais a fundo esse problema.

Responder1

"Corrupção de dados na memória detectada"não significa necessariamente que a RAM do hardware esteja ruim. Também pode indicar que um bloco foi lido ou gravado incorretamente, o armazenamento mudou um pouco ou está falhando, possivelmente bugs no sistema de arquivos e algumas outras causas.

Reverter para um instantâneo provavelmente não resolverá o problema se houver alguma corrupção latente no sistema de arquivos; ele aparecerá novamente mais tarde.

Em vez disso, você deve usar xfs_repairo sistema de arquivos, mas como é o sistema de arquivos raiz, você precisaráinicializar a partir da mídia de instalaçãoou um ambiente de resgate fornecido pelo seu provedor VPS.

Se xfs_repairnão conseguir reparar o sistema de arquivos, você pode executar xfs_repair -Lo que limpará o log do XFS (que pode estar corrompido) e então tentar reparar o sistema de arquivos novamente.

informação relacionada