
Моя корневая ( /
) файловая система перемонтируется как доступная только для чтения после того, как система некоторое время работала. Кажется, это занимает от 3 до 48 часов. Эта система работает под управлением Ubuntu desktop 14.04. Ее основная функция — запуск нескольких виртуальных машин для меня. Вот конфигурация системы.
- Dell XPS8700
- Intel i7 4770 24 ГБ оперативной памяти
- 128 ГБ mSATA SSD (на нем находится
/
файловая система, которая доставляла мне проблемы. Он также содержит подкачку и другие системные файловые системы) - 3x 1TB SATA-диска (здесь проблем нет) Но они хранят файлы ВМ. В настоящее время он запускает только 3 ВМ.
Похожая система (HP) имеет 32 ГБ оперативной памяти, но та же конфигурация, в остальном не имеет этой проблемы. Она запускает 12 виртуальных машин, никаких проблем.
После /
перемонтирования в режиме только для чтения виртуальные машины умирают, поскольку они записывают во временную папку на SSD. Я не могу этого сделать sudo
на машине. И если я пытаюсь запустить команду терминала "mount", терминал просто закрывается. После перезагрузки меня просят исправить ошибку файловой системы (при запуске), что я и делаю, и это работает нормально до следующего инцидента.
У меня есть резервные копии виртуальных машин (плюс их диски, похоже, в порядке). Но я бы лучше исправил эту установку, чем переделывал ее, так как я внес изменения, которые настраивают систему по моему вкусу. Greping dmesg
для EXT4-fs показывает это, но я думаю, что это просто запуск. Ошибок нет.
[ 1.331446] EXT4-fs (sde1): mounted filesystem with ordered data mode. Opts: (null)
[ 2.474298] EXT4-fs (sde1): re-mounted. Opts: errors=remount-ro
[ 2.584750] EXT4-fs (sda): mounted filesystem with ordered data mode. Opts: (null)
[ 2.637858] EXT4-fs (sdc): mounted filesystem with ordered data mode. Opts: (null)
[ 2.768738] EXT4-fs (sdd1): mounted filesystem with ordered data mode. Opts: (null)
[ 2.850718] EXT4-fs (sdb1): mounted filesystem with ordered data mode. Opts: (null)
Я запустил смарт-тест в Disks. Но там написано, что все в порядке. (А машине всего 3 месяца. Эта проблема актуальна уже около 3 недель.
Я открыт для идей.
EDIT 1: Вчера вечером произошел сбой. Поэтому я немного покопался. charles@VMH2:/var/log$ cat /var/log/syslog.1 | grep sde1
18 июля 19:19:40 Ядро VMH2: [ 0.892391] sde: sde1 sde2 < sde5 >
18 июля 19:19:40 Ядро VMH2: [ 1.331446] EXT4-fs (sde1): смонтированная файловая система с упорядоченным режимом данных. Opts: (null)
18 июля 19:19:40 Ядро VMH2: [ 2.474298] EXT4-fs (sde1): перемонтировано. Opts: ошибки=remount-ro
19 июля 04:49:13 Ядро VMH2: [27950.072962] ИНФОРМАЦИЯ: задача jbd2/sde1-8:212 заблокирована более чем на 120 секунд.
19 июля 04:49:13 Ядро VMH2: [27950.072968] jbd2/sde1-8 D ffff88061ecd30c0 0 212 2 0x00000000
19 июля 11:48:50 Ядро VMH2: [ 0.888753] sde: sde1 sde2 < sde5 >
19 июля 11:48:50 Ядро VMH2: [ 0.961088] EXT4-fs (sde1): смонтированная файловая система с упорядоченным режимом данных. Opts: (null)
19 июля 11:48:50 Ядро VMH2: [ 1.999033] EXT4-fs (sde1): перемонтировано. Opts: ошибки=remount-ro charles@VMH2:/var/log$ cat /var/log/syslog.1 | grep 27950
19 июля 04:49:13 Ядро VMH2: [27950.072962] ИНФОРМАЦИЯ: задача jbd2/sde1-8:212 заблокирована более чем на 120 секунд.
19 июля 04:49:13 Ядро VMH2: [27950.072966] Испорчен: P OE 3.16.0-43-generic #58~14.04.1-Ubuntu
19 июля 04:49:13 Ядро VMH2: [27950.072967] "echo 0 > /proc/sys/kernel/hung_task_timeout_secs" отключает это сообщение.
19 июля 04:49:13 Ядро VMH2: [27950.072968] jbd2/sde1-8 D ffff88061ecd30c0 0 212 2 0x000000000 19 июля 04:49:13 Ядро VMH2: [27950.072971]
ffff8805f8297cb0 00000000000000046 ffff8805f8218a30 ffff8805f8297fd8 19 июля 04:49:13 Ядро VMH2: [27950.072973]
00000000000130c0 00000000000130c0 ffff8802e8570000 ffff8805f8297d98
19 июля 04:49:13 Ядро VMH2: [27950.072975] ffff8805f89160b8 ffff8805f8218a30 ffff8805dc2c9e00 ffff8805f8297d80
19 июля 04:49:13 Ядро VMH2: [27950.072977] Трассировка вызова:
Мне кажется, что INFO: task jbd2/sde1-8:212 blocked for more than 120 seconds. является источником моих проблем. Я просто не знаю, что означает это сообщение (или что-либо после него). Кто-нибудь знает, что здесь происходит?