Qualquer forma de ser notificado sobre erros EXT4 quando montado com "errors=continue"

Qualquer forma de ser notificado sobre erros EXT4 quando montado com "errors=continue"

Estou prototipando um novo sistema embarcado que usa ext4 na memória Flash. Esses sistemas serão implantados remotamente sem nenhum administrador de sistema local, portanto, qualquer diagnóstico também deverá ser feito remotamente por meio de uma rede.

A opção de montagem padrão para ext4 é definir o FS para somente leitura quando encontrar um erro. Acho que isso é muito grave para o meu caso, pois pode fazer com que muitas operações parem de funcionar e impedir logins remotos.

Eu preferiria manter o sistema funcionando (e tolerar alguns erros de FS). Portanto, para o meu caso, a opção de montagem "errors=continue" parece mais apropriada. No entanto, gostaria que meu aplicativo fosse notificado quando ocorrer algum erro de FS, para que ele possa registrá-los como problemas de alta prioridade e enviar essas informações. de volta aos nossos servidores.

Alguém sabe se isso pode ser feito com o kernel Linux padrão (4.8.1 em x86_64)?

Responder1

Eu preferiria manter o sistema funcionando (e tolerar alguns erros de FS)

Isto é uma contradição em termos. Quando você receber erros de FS, seu sistema não funcionará por muito tempo. Na verdade, errors=continueé muito provável que executar with danifique ainda mais um sistema de arquivos corrompido até que não haja qualquer esperança de recuperação sensata.

Se você deseja que seu aplicativo faça o melhor possível para continuar a operação, mesmo que haja erros de FS, ele deve ter um script que detecte quando /se tornou somente leitura e reinicialize com um fsck forçado.

Em algum momento tudo vai à falência. É a lei do aumento da entropia. Não há nada que você possa fazer a respeito, a não ser aderir a princípios sólidos de engenharia e obter peças de alta qualidade para casos de uso de missão crítica.

informação relacionada