Приостановка с root-доступом на USB

Приостановка с root-доступом на USB

У меня есть ноутбук с Ubuntu 14.04 из корневой файловой системы на USB-накопителе. Это работает не очень хорошо, потому что после пробуждения из спящего режима ext4 часто пытается записать данные в корневую файловую систему до того, как USB будет готов.

Вот что я вижу в журнале ядра, когда это происходит. Обратите внимание, как я получаю кучу ошибок ввода-вывода на sda1, а затем через секунду ядро ​​наконец обнаруживает USB-накопитель.

[ 2826.517419] wlan0: associated
[ 2826.517452] IPv6: ADDRCONF(NETDEV_CHANGE): wlan0: link becomes ready
[ 2827.575371] EXT4-fs warning (device sda1): ext4_end_bio:317: I/O error -5 writing to inode 1733735 (offset 0 size 0 starting block 12629950)
[ 2827.575380] Buffer I/O error on device sda1, logical block 12629694
[ 2827.575400] EXT4-fs warning (device sda1): ext4_end_bio:317: I/O error -5 writing to inode 3148603 (offset 0 size 8192 starting block 12844470)
[ 2827.575404] Buffer I/O error on device sda1, logical block 12844212
[ 2827.575411] Buffer I/O error on device sda1, logical block 12844213
[ 2827.575448] EXT4-fs warning (device sda1): ext4_end_bio:317: I/O error -5 writing to inode 3015015 (offset 0 size 90112 starting block 6588832)
[ 2827.575453] Buffer I/O error on device sda1, logical block 6588576
[ 2827.575461] Buffer I/O error on device sda1, logical block 6588577
[ 2827.575465] Buffer I/O error on device sda1, logical block 6588578
[ 2827.575469] Buffer I/O error on device sda1, logical block 6588579
[ 2827.575473] Buffer I/O error on device sda1, logical block 6588580
[ 2827.575477] Buffer I/O error on device sda1, logical block 6588581
[ 2827.575481] Buffer I/O error on device sda1, logical block 6588582
[ 2828.857284] sd 0:0:0:0: [sda] No Caching mode page found
[ 2828.857293] sd 0:0:0:0: [sda] Assuming drive cache: write through

Сначала нет видимых признаков за пределами журнала ядра, что проблема возникла, но если я позволю Ubuntu работать и дальше, то файловая система начнет получать ошибки и в конечном итоге перейдет в режим только для чтения. В этот момент мне придется перезагрузиться в режим восстановления и fsck.ext4вручную запустить из оболочки root, чтобы восстановить файловую систему.

Можно ли изменить какие-либо настройки, чтобы доступ к корневому устройству после выхода из спящего режима можно было отложить до тех пор, пока USB-накопитель не будет готов?

решение1

Причина, по которой эта проблема наблюдается только с USB-устройствами, а не с другими устройствами, заключается в сочетании двух факторов:

  • USB-накопитель, в отличие от других носителей информации, в своей работе опирается на потоки ядра.
  • При выходе из режима ожидания ядро ​​одновременно пробуждает все потоки.

В результате во время возобновления работы будет происходить гонка между USB-системой, с одной стороны, пытающейся обнаружить носитель, и системным журналом, с другой стороны, пытающимся записать сообщения журнала из режима ожидания и возобновления работы на диск.

Если syslog попытается выполнить запись до того, как будет обнаружено USB-устройство, ext4 получит ошибку, которая по какой-то причине не будет обработана должным образом, и в конечном итоге файловой системе потребуется вручную запустить fsck.

Решение, которое я нашел, состояло в том, чтобы дать потокам ядра 12-секундную фору перед тем, как будут пробуждены другие потоки. Вот изменения, которые мне пришлось внести в ядро, чтобы это заработало:

--- linux-3.13.0/kernel/power/suspend.c.orig    2014-01-20 03:40:07.000000000 +0100
+++ linux-3.13.0/kernel/power/suspend.c 2014-08-04 00:57:43.847038640 +0200
@@ -299,6 +299,8 @@
        goto Resume_devices;
 }

+unsigned int resume_delay = 0;
+
 /**
  * suspend_finish - Clean up before finishing the suspend sequence.
  *
@@ -307,6 +309,15 @@
  */
 static void suspend_finish(void)
 {
+       if (resume_delay) {
+               /* Give kernel threads a head start, such that usb-storage
+                * can detect devices before syslog attempts to write log
+                * messages from the suspend code.
+                */
+               thaw_kernel_threads();
+               pr_debug("PM: Sleeping for %d milliseconds.\n", resume_delay);
+               msleep(resume_delay);
+       }
        suspend_thaw_processes();
        pm_notifier_call_chain(PM_POST_SUSPEND);
        pm_restore_console();
--- linux-3.13.0/kernel/sysctl.c.orig   2014-08-04 08:11:26.000000000 +0200
+++ linux-3.13.0/kernel/sysctl.c        2014-08-03 23:27:23.796278219 +0200
@@ -277,8 +277,17 @@
 static int max_extfrag_threshold = 1000;
 #endif

+extern unsigned int resume_delay;
+
 static struct ctl_table kern_table[] = {
        {
+               .procname       = "resume_delay",
+               .data           = &resume_delay,
+               .maxlen         = sizeof(unsigned int),
+               .mode           = 0644,
+               .proc_handler   = proc_dointvec,
+       },
+       {
                .procname       = "sched_child_runs_first",
                .data           = &sysctl_sched_child_runs_first,
                .maxlen         = sizeof(unsigned int),

Связанный контент