У нас наблюдаются сбои на наших SSD VPS, все они работают на KVM: сбои происходят по разным причинам; в спешке по восстановлению сервиса моя команда использует его для перезагрузки предыдущего снимка машины и никогда не сохраняет журналы.
В любом случае, среди всех различных обстоятельств сбоев, повторяющимся фактом является следующее corruption of in-memory data
: наш провайдер VPS сказал нам, что его оборудование работает нормально, но я не знаю, как читать предоставленный мне ужасный журнал.
Что происходит при обнаружении «повреждения данных в памяти»?Может ли это быть из-за поломки оперативной памяти или есть другие виды повреждения памяти?
Забавно: провайдер VPS, использующий VMware, никогда не доставлял нам проблем, а вот провайдер, использующий KVM, просто сводит нас с ума этими сбоями.
Редактировать 1: Я ни в коем случае не требую, чтобы вы, люди, вывели решение из этого жалкого журнала. Я застрял с этой проблемой, где не предоставлено никакого приличного журнала, memtest
бесполезного, поскольку оборудование эмулируется, а поставщик VPS подтвердил, что его оборудование в порядке, и ни один экземпляр KVM или QEMU не рухнул. corruption of in-memory data detected
преследует меня, и я не могу придумать никакого продуктивного подхода к дальнейшему исследованию этой проблемы.
решение1
«Обнаружено повреждение данных в памяти»не обязательно означает, что аппаратная оперативная память неисправна. Это также может означать, что блок был прочитан или записан неправильно, хранилище немного перевернуто или иным образом дает сбой, возможны ошибки файловой системы и несколько других причин.
Возврат к моментальному снимку, скорее всего, не решит проблему, если в файловой системе есть скрытое повреждение; оно просто проявится снова позже.
Вместо этого вам следует использовать xfs_repair
файловую систему, но поскольку это корневая файловая система, вам нужно будетзагрузка с установочного носителяили среда восстановления, предоставляемая вашим провайдером VPS.
Если xfs_repair
восстановить файловую систему не удалось, вы можете запустить , xfs_repair -L
который очистит журнал XFS (который сам может быть поврежден), а затем попытаться восстановить файловую систему еще раз.