Обновления 18.04 ломают grub и не дают загружаться

Обновления 18.04 ломают grub и не дают загружаться

Сегодня я столкнулся с проблемой, которая не давала моей системе загрузиться. Система установлена ​​заново, так как я недавно переустановил Ubuntu 18.04.3 через Live USB с официальным Ubuntu ISO.

Это моя третья или четвертая попытка, и я сталкиваюсь с той же проблемой:

  • Установить систему с параметрами по умолчанию

  • Перезагрузите сразу после установки, проблем не возникло.

  • Обновите мою систему. Сейчас она сломана, так что у меня ее больше нет, но я просто запустил регулярные обновления сразу после установки системы.

  • После перезагрузки моя система снова выглядит сломанной. Я больше не могу загрузить Ubuntu. Система продолжает показывать меню grub, а затем зависает, если я выбираю любую опцию.
  • Каждый раз, когда это происходит, я переустанавливаю Ubuntu 18.04.3 и сталкиваюсь с той же проблемой (обновляюсь и застреваю в цикле загрузки).
  • У нас есть ошибка, показанная dmesg:
EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
EDAC amd64: Error: Errorprobing instamce: 0

Мы воспроизвели эту ошибку на другом компьютере (редактировать: 3 других компьютера) с недельной установкой и столкнулись с той же проблемой. На других компьютерах установлено похожее очень новое оборудование (последний процессор AMD, AMD Epyc 7302p).

Коллега сделал обновление и у него тоже возникла проблема. Ему пришлось откатить версию ядра с 5.0.0-36-generic на 5.0.0-35-generic, чтобы восстановить работоспособность системы.

Обновлять:Судя по всему, ошибка возникает из-за обновления пакета. Поскольку я установил Ubuntu 18.04 с нуля, с live USB с версией ядра 5.0.0-23-generic и когда я позволил установщику загрузить обновления во время установки, он обновил ядро ​​до версии 5.0.0-36-generic, не сломав grub. Однако, когда я попытался обновить другие пакеты (с помощью apt upgrade), grub снова сломался.

Во время обновления я увидел, что один пакет изменяет некоторые файлы в разделе /boot, но, к сожалению, у меня не было времени посмотреть, какой именно.

Кто-нибудь еще сталкивался с этой проблемой? Есть ли у кого-нибудь решение?

решение1

Та же проблема после серии доверенных обновлений на двух Dell Precision 5820. У первой две ОС на отдельных дисках по 2 ТБ:

  • sda=Ubuntu18.04
  • sdb=Windows10

Во втором — три ОС на отдельных дисках по 2 ТБ:

  • sda=Ubuntu18.04
  • sdb=Fedora31
  • sdc=Debian9

В первый раз я запустил следующее:

  1. sudo apt update
  2. Я вызвал Software Updater.
  3. Я разрешил ему обновить все.
  4. когда дело дошло до обновления GRUB, он спросил, хочу ли я заменить свой, остаться с локальным или сравнить два. Я выбрал сравнение локального и нового, что звучало просто, консольное чтение, гласящееНастройка shim-signed (1.37~18.04.3+15+1533136590.3beb971-0ubuntu1) ...при выполнении какого-то обновления (хотя я сказал НЕТ этому делать!) и потребовалась перезагрузка для освобождения системы.
  5. Вернувшись, я открыл терминал и запустилsudo update-grub
  6. Я снова перезапустился и вошел.

Вторая система (синхронизированная, поскольку обе работают со вчерашней флэш-установки Dell Restore, которая преодолела «цикл входа», вызванный тем, что AMD не выпустила свои драйверы до того, как Dell заморозила выпуск системы с видеокартой 2100X, бесконечно ожидающей ввода данных входа, который не мог быть прочитан в коде/ядре 16.04) отличалась, потому что я сказал (в том же запросе об обновлении GRUB), что хочу остаться с локальной, которая позволяла мне выбирать/запускать три мои ОС. После перезапуска она выдала мне ошибки во всех трех, что говорит мне о том, что GRUB сломан (как и код установщика программного обеспечения).

  • Ubuntu: Раньше я F12обходил меню GRUB и выбирал Ubuntu, но это не помогло.

    0.3294701 Kernel offset: ...
    0.3294911 --- [ end Kernel panic - not synching: VFS: 
    Unable to mount fs on unknown-block(0,0)
    

    Поэтому я перезагрузился.

  • Debian: Я F12обходил меню GRUB и выбирал Debian, но это не сработало. Он перешел в окно System Tester, которое я нажал, Escчтобы закрыть, а затем перезагрузился.

  • Fedora: Я F12обходил меню GRUB и выбирал Fedora. Сначала все было нормально. Я вошел, и она автоматически обновилась.
    Затем она перешла в меню EFI, где я снова выбрал Fedora. Она добралась до фиолетового Ubuntuнизкое разрешениеэкран и повесил трубку.

Это утомительно. Должно бытьне-кодировщикQA процесса выпуска и полное регрессионное (и сборка, и приемка, и выпуск) тестирование, особенно во всех областях, затронутых измененным кодом, добавление новых тестов для нового кода! Это начинает походить на модель релизов Microsoft и Apple, где как только это работает, я не смею больше нажимать[Хорошо]для обновления запросов из-за обоснованного страха получить неотслеживаемую и фатальную (без возможности обхода) «проблему» с высоким приоритетом/высокой степенью серьезности, что приведет к потере еще большего количества моего времени, в то время как мне придется заниматься контролем качества, а тестирование кого-то другого пропустить.

Это не то, как релиз определяется ACM, IEEE, ISO, SQA и т. д. Мне нужно заменить несохраненный файл в системе, в которую невозможно войти, т. е. переустановить после обнуления.

решение2

Я также столкнулся с этим при использовании 32-ядерного процессора AMD EPYC 7452:

Aug 28 13:57:40 server01 kernel: [    8.196170] MCE: In-kernel MCE decoding enabled.
Aug 28 13:57:40 server01 kernel: [    8.201319] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 13:57:40 server01 kernel: [    8.201320] EDAC amd64: F17h detected (node 0).
Aug 28 13:57:40 server01 kernel: [    8.201375] EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
Aug 28 13:57:40 server01 kernel: [    8.201378] EDAC amd64: Error: Error probing instance: 0
Aug 28 13:57:40 server01 kernel: [    8.320565] EDAC amd64: Node 0: DRAM ECC enabled.

Исправление заключалось в установке ядер LTS Enablement Stacks (также называемых HWE или Hardware Enablement):

apt install --install-recommends linux-generic-hwe-18.04

Теперь система загружается с этим и не выдает ошибку:

Aug 28 14:07:39 server01 kernel: [  117.977960] MCE: In-kernel MCE decoding enabled.
Aug 28 14:07:39 server01 kernel: [  117.985049] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 14:07:39 server01 kernel: [  117.985051] EDAC amd64: F17h_M30h detected (node 0).
Aug 28 14:07:39 server01 kernel: [  117.985283] EDAC MC: UMC0 chip selects:
Aug 28 14:07:39 server01 kernel: [  117.985285] EDAC amd64: MC: 0: 65536MB 1: 65536MB
Aug 28 14:07:39 server01 kernel: [  117.985286] EDAC amd64: MC: 2: 65536MB 3: 65536MB

Связанный контент