
Meu /
sistema de arquivos raiz () é remontado como leitura somente depois que o sistema estiver ativo por algum tempo. Isso parece variar de 3 a 48 horas. Este sistema está executando o Ubuntu desktop 14.04. Sua função principal é executar várias máquinas virtuais para mim. Aqui está a configuração do sistema.
- Dell XPS 8700
- Intel i7 4770 24GB de RAM
- SSD mSATA de 128 GB (ele contém o
/
sistema de arquivos que está me causando problemas. Ele também contém swap e outros sistemas de arquivos do sistema) - 3x unidade SATA de 1 TB (sem problema aqui) Mas eles contêm os arquivos da VM. Atualmente, isso executa apenas 3 VMs.
Um sistema semelhante (HP) possui 32 GB de RAM, mas a mesma configuração não apresenta esse problema. Ele executa 12 VMs sem problemas.
Após /
remontagens como somente leitura, as VMs morrem enquanto gravam em um local temporário no SSD. Não consigo sudo
na máquina. E se eu tentar executar o comando do terminal "mount", o terminal simplesmente fecha. Após a reinicialização, sou solicitado a corrigir o erro do sistema de arquivos (na inicialização), o que faço e funciona bem até o próximo incidente.
Eu tenho backups das VMs (além disso, suas unidades parecem estar bem). Mas prefiro consertar esta instalação do que refazê-la, pois fiz alterações que personalizam o sistema ao meu gosto. Greping dmesg
para EXT4-fs mostra isso, mas acho que é apenas uma inicialização. Sem erros.
[ 1.331446] EXT4-fs (sde1): mounted filesystem with ordered data mode. Opts: (null)
[ 2.474298] EXT4-fs (sde1): re-mounted. Opts: errors=remount-ro
[ 2.584750] EXT4-fs (sda): mounted filesystem with ordered data mode. Opts: (null)
[ 2.637858] EXT4-fs (sdc): mounted filesystem with ordered data mode. Opts: (null)
[ 2.768738] EXT4-fs (sdd1): mounted filesystem with ordered data mode. Opts: (null)
[ 2.850718] EXT4-fs (sdb1): mounted filesystem with ordered data mode. Opts: (null)
Eu executei um teste inteligente em discos. Mas diz que está tudo bem lá. (E a máquina tem apenas 3 meses. Esse problema tem se destacado há cerca de 3 semanas.
Estou aberto a ideias.
EDIT 1: Ele caiu ontem à noite. Então eu fiz algumas pesquisas. charles@VMH2:/var/log$ cat /var/log/syslog.1 | grep sde1
18 de julho 19:19:40 Kernel VMH2: [0.892391] sde: sde1 sde2 <sde5 >
18 de julho 19:19:40 Kernel VMH2: [1.331446] EXT4-fs (sde1): sistema de arquivos montado com modo de dados ordenado. Opção: (nulo)
18 de julho 19:19:40 Kernel VMH2: [2.474298] EXT4-fs (sde1): remontado. Opts: erros = remount-ro
19 de julho 04:49:13 Kernel VMH2: [27950.072962] INFO: tarefa jbd2/sde1-8:212 bloqueada por mais de 120 segundos.
19 de julho 04:49:13 Kernel VMH2: [27950.072968] jbd2/sde1-8 D ffff88061ecd30c0 0 212 2 0x00000000
19 de julho 11:48:50 Kernel VMH2: [0.888753] sde: sde1 sde2 <sde5>
19 de julho 11:48: 50 Kernel VMH2: [0.961088] EXT4-fs (sde1): sistema de arquivos montado com modo de dados ordenados. Opção: (nulo)
19 de julho 11:48:50 Kernel VMH2: [1.999033] EXT4-fs (sde1): remontado. Opções: erros=remount-ro charles@VMH2:/var/log$ cat /var/log/syslog.1 | grep 27950
19 de julho 04:49:13 Kernel VMH2: [27950.072962] INFO: tarefa jbd2/sde1-8:212 bloqueada por mais de 120 segundos.
19 de julho 04:49:13 Kernel VMH2: [27950.072966] Tainted: P OE 3.16.0-43-generic #58 ~ 14.04.1-Ubuntu
19 de julho 04:49:13 Kernel VMH2: [27950.072967] "echo 0> / proc/sys/kernel/hung_task_timeout_secs" desativa esta mensagem.
19 de julho 04:49:13 Kernel VMH2: [27950.072968] jbd2/sde1-8 D ffff88061ecd30c0 0 212 2 0x00000000
19 de julho 04:49:13 Kernel VMH2: [27950.072971] 000000000000046 ffff8805f8218a30 ffff8805f8297fd8 19 de julho
04:49:13 Kernel VMH2 : [27950.072973] 00000000000130c0 0000000000130c0 ffff8802e8570000 ffff8805f8297d98
19 de julho 04:49:13 Kernel VMH2: [27950.072975] 60b8 ffff8805f8218a30 ffff8805dc2c9e00 ffff8805f8297d80
19 de julho 04:49:13 Kernel VMH2: [27950.072977] Rastreamento de chamada:
Parece-me que INFO: tarefa jbd2/sde1-8:212 bloqueada por mais de 120 segundos. é a fonte dos meus problemas. Só não sei o que a mensagem significa (ou qualquer coisa depois dela). Alguém sabe o que está acontecendo aqui?