Сегодня я столкнулся с проблемой, которая не давала моей системе загрузиться. Система установлена заново, так как я недавно переустановил Ubuntu 18.04.3 через Live USB с официальным Ubuntu ISO.
Это моя третья или четвертая попытка, и я сталкиваюсь с той же проблемой:
Установить систему с параметрами по умолчанию
Перезагрузите сразу после установки, проблем не возникло.
Обновите мою систему. Сейчас она сломана, так что у меня ее больше нет, но я просто запустил регулярные обновления сразу после установки системы.
- После перезагрузки моя система снова выглядит сломанной. Я больше не могу загрузить Ubuntu. Система продолжает показывать меню grub, а затем зависает, если я выбираю любую опцию.
- Каждый раз, когда это происходит, я переустанавливаю Ubuntu 18.04.3 и сталкиваюсь с той же проблемой (обновляюсь и застреваю в цикле загрузки).
- У нас есть ошибка, показанная dmesg:
EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?) EDAC amd64: Error: Errorprobing instamce: 0
Мы воспроизвели эту ошибку на другом компьютере (редактировать: 3 других компьютера) с недельной установкой и столкнулись с той же проблемой. На других компьютерах установлено похожее очень новое оборудование (последний процессор AMD, AMD Epyc 7302p).
Коллега сделал обновление и у него тоже возникла проблема. Ему пришлось откатить версию ядра с 5.0.0-36-generic на 5.0.0-35-generic, чтобы восстановить работоспособность системы.
Обновлять:Судя по всему, ошибка возникает из-за обновления пакета. Поскольку я установил Ubuntu 18.04 с нуля, с live USB с версией ядра 5.0.0-23-generic и когда я позволил установщику загрузить обновления во время установки, он обновил ядро до версии 5.0.0-36-generic, не сломав grub. Однако, когда я попытался обновить другие пакеты (с помощью apt upgrade), grub снова сломался.
Во время обновления я увидел, что один пакет изменяет некоторые файлы в разделе /boot, но, к сожалению, у меня не было времени посмотреть, какой именно.
Кто-нибудь еще сталкивался с этой проблемой? Есть ли у кого-нибудь решение?
решение1
Та же проблема после серии доверенных обновлений на двух Dell Precision 5820. У первой две ОС на отдельных дисках по 2 ТБ:
- sda=Ubuntu18.04
- sdb=Windows10
Во втором — три ОС на отдельных дисках по 2 ТБ:
- sda=Ubuntu18.04
- sdb=Fedora31
- sdc=Debian9
В первый раз я запустил следующее:
sudo apt update
- Я вызвал Software Updater.
- Я разрешил ему обновить все.
- когда дело дошло до обновления GRUB, он спросил, хочу ли я заменить свой, остаться с локальным или сравнить два. Я выбрал сравнение локального и нового, что звучало просто, консольное чтение, гласящееНастройка shim-signed (1.37~18.04.3+15+1533136590.3beb971-0ubuntu1) ...при выполнении какого-то обновления (хотя я сказал НЕТ этому делать!) и потребовалась перезагрузка для освобождения системы.
- Вернувшись, я открыл терминал и запустил
sudo update-grub
- Я снова перезапустился и вошел.
Вторая система (синхронизированная, поскольку обе работают со вчерашней флэш-установки Dell Restore, которая преодолела «цикл входа», вызванный тем, что AMD не выпустила свои драйверы до того, как Dell заморозила выпуск системы с видеокартой 2100X, бесконечно ожидающей ввода данных входа, который не мог быть прочитан в коде/ядре 16.04) отличалась, потому что я сказал (в том же запросе об обновлении GRUB), что хочу остаться с локальной, которая позволяла мне выбирать/запускать три мои ОС. После перезапуска она выдала мне ошибки во всех трех, что говорит мне о том, что GRUB сломан (как и код установщика программного обеспечения).
Ubuntu: Раньше я F12обходил меню GRUB и выбирал Ubuntu, но это не помогло.
0.3294701 Kernel offset: ... 0.3294911 --- [ end Kernel panic - not synching: VFS: Unable to mount fs on unknown-block(0,0)
Поэтому я перезагрузился.
Debian: Я F12обходил меню GRUB и выбирал Debian, но это не сработало. Он перешел в окно System Tester, которое я нажал, Escчтобы закрыть, а затем перезагрузился.
Fedora: Я F12обходил меню GRUB и выбирал Fedora. Сначала все было нормально. Я вошел, и она автоматически обновилась.
Затем она перешла в меню EFI, где я снова выбрал Fedora. Она добралась до фиолетового Ubuntuнизкое разрешениеэкран и повесил трубку.
Это утомительно. Должно бытьне-кодировщикQA процесса выпуска и полное регрессионное (и сборка, и приемка, и выпуск) тестирование, особенно во всех областях, затронутых измененным кодом, добавление новых тестов для нового кода! Это начинает походить на модель релизов Microsoft и Apple, где как только это работает, я не смею больше нажимать[Хорошо]для обновления запросов из-за обоснованного страха получить неотслеживаемую и фатальную (без возможности обхода) «проблему» с высоким приоритетом/высокой степенью серьезности, что приведет к потере еще большего количества моего времени, в то время как мне придется заниматься контролем качества, а тестирование кого-то другого пропустить.
Это не то, как релиз определяется ACM, IEEE, ISO, SQA и т. д. Мне нужно заменить несохраненный файл в системе, в которую невозможно войти, т. е. переустановить после обнуления.
решение2
Я также столкнулся с этим при использовании 32-ядерного процессора AMD EPYC 7452:
Aug 28 13:57:40 server01 kernel: [ 8.196170] MCE: In-kernel MCE decoding enabled.
Aug 28 13:57:40 server01 kernel: [ 8.201319] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 13:57:40 server01 kernel: [ 8.201320] EDAC amd64: F17h detected (node 0).
Aug 28 13:57:40 server01 kernel: [ 8.201375] EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
Aug 28 13:57:40 server01 kernel: [ 8.201378] EDAC amd64: Error: Error probing instance: 0
Aug 28 13:57:40 server01 kernel: [ 8.320565] EDAC amd64: Node 0: DRAM ECC enabled.
Исправление заключалось в установке ядер LTS Enablement Stacks (также называемых HWE или Hardware Enablement):
apt install --install-recommends linux-generic-hwe-18.04
Теперь система загружается с этим и не выдает ошибку:
Aug 28 14:07:39 server01 kernel: [ 117.977960] MCE: In-kernel MCE decoding enabled.
Aug 28 14:07:39 server01 kernel: [ 117.985049] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 14:07:39 server01 kernel: [ 117.985051] EDAC amd64: F17h_M30h detected (node 0).
Aug 28 14:07:39 server01 kernel: [ 117.985283] EDAC MC: UMC0 chip selects:
Aug 28 14:07:39 server01 kernel: [ 117.985285] EDAC amd64: MC: 0: 65536MB 1: 65536MB
Aug 28 14:07:39 server01 kernel: [ 117.985286] EDAC amd64: MC: 2: 65536MB 3: 65536MB
- Ubuntu исправила похожую ошибку в Ubuntu 19.10, но ее пока нет в основном ядре 18.04:https://bugs.launchpad.net/ubuntu/+source/linux/+bug/1869235
- В OpenSUSE есть похожая ошибка, исправление которой можно найти здесьhttps://www.suse.com/support/kb/doc/?id=000019537