As atualizações 18.04 quebram o grub e impedem a inicialização

As atualizações 18.04 quebram o grub e impedem a inicialização

Hoje encontrei um problema que impediu a inicialização do meu sistema. O sistema é uma instalação nova, já que reinstalei recentemente o Ubuntu 18.04.3 através de um USB ativo com o ISO oficial do Ubuntu.

Esta é minha terceira ou quarta tentativa e estou enfrentando o mesmo problema:

  • Instale o sistema com parâmetros padrão

  • Reinicie imediatamente após a instalação, sem problemas.

  • Atualize meu sistema. No momento está quebrado, então não o tenho mais, mas apenas executei as atualizações regulares logo após instalar o sistema.

  • Depois de reiniciar novamente, meu sistema parece quebrado. Não consigo mais inicializar no Ubuntu. O sistema continua mostrando o menu grub e falha se eu selecionar alguma opção.
  • Cada vez que isso acontece, eu reinstalo o Ubuntu 18.04.3 e tenho o mesmo problema (atualizo e fico preso em um loop de inicialização).
  • Temos um erro mostrado pelo dmesg:
EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
EDAC amd64: Error: Errorprobing instamce: 0

Reproduzimos esse erro com outro computador (editar: 3 outros computadores) com uma instalação de uma semana atrás e encontramos exatamente o mesmo problema. Os outros computadores possuem hardware semelhante muito recente (CPU AMD mais recente, AMD Epyc 7302p).

Um colega fez a atualização e também teve o problema. Ele teve que reverter sua versão do kernel de 5.0.0-36-generic para 5.0.0-35-generic para recuperar um sistema funcional.

Atualizar:Aparentemente, o erro vem de uma atualização de pacote. Porque instalei o Ubuntu 18.04 do zero, a partir de um live USB com a versão do kernel 5.0.0-23-generic e ao deixar o instalador baixar as atualizações durante a instalação, ele atualiza o kernel para a versão 5.0.0-36-generic sem quebrar a comida. Porém, quando tentei atualizar os outros pacotes (com apt upgrade) quebrou o grub mais uma vez.

Durante a atualização, vi que um pacote estava modificando alguns arquivos na partição /boot mas, infelizmente, não tive tempo de ver qual deles.

Alguém mais teve esse problema? Alguém tem uma solução?

Responder1

O mesmo problema após uma série de atualizações confiáveis ​​em dois Dell Precision 5820s. O primeiro possui dois sistemas operacionais em unidades separadas de 2 TB:

  • sda=Ubuntu18.04
  • sdb=Windows10

O segundo possui três sistemas operacionais em unidades separadas de 2 TB:

  • sda=Ubuntu18.04
  • sdb=Fedora31
  • sdc=Debian9

No primeiro executei o seguinte:

  1. sudo apt update
  2. Invoquei o Atualizador de Software.
  3. Eu permiti atualizar tudo.
  4. quando se tratou de atualizar o GRUB, ele perguntou se eu queria substituir o meu, ficar com o local ou comparar os dois. Optei por comparar o local e o novo, o que parecia simples - uma leitura do console informandoConfigurando o shim assinado (1.37 ~ 18.04.3 + 15 + 1533136590.3beb971-0ubuntu1) ...ao fazer alguma atualização (mesmo que eu tenha dito NÃO para fazer isso!) e precisei reiniciar para liberar o sistema.
  5. Quando voltei, abri um terminal e executeisudo update-grub
  6. Reiniciei novamente e entrei.

O segundo sistema (em sincronia, já que ambos foram executados a partir da instalação flash do Dell Restore de ontem que superou o "loop de login" causado pela AMD não obter seus drivers antes que a Dell congelasse a versão do sistema com a placa gráfica 2100X aguardando indefinidamente a entrada de login que não podia ser lida no código/kernel 16.04) era diferente porque eu disse (na mesma consulta sobre uma atualização do GRUB) que queria ficar com o local que me permitia selecionar/executar meus três sistemas operacionais. Após a reinicialização, ocorreram erros em todos os três, o que indica que o GRUB está quebrado (assim como o código do instalador de software)

  • Ubuntu: Eu costumava F12ignorar o menu GRUB e selecionei Ubuntu, mas falhou.

    0.3294701 Kernel offset: ...
    0.3294911 --- [ end Kernel panic - not synching: VFS: 
    Unable to mount fs on unknown-block(0,0)
    

    Então eu reiniciei.

  • Debian: Eu costumava F12ignorar o menu GRUB e selecionei Debian, mas falhou. Ele foi para a janela do System Tester que eu cliquei Escpara sair e reiniciei.

  • Fedora: Eu costumava F12ignorar o menu GRUB e selecionei o Fedora. No início, parecia bom. Entrei e ele foi atualizado automaticamente.
    Em seguida, fui para o menu EFI, onde selecionei novamente o Fedora. Chegou ao Ubuntu roxobaixa resoluçãotela e desliguei lá.

Isso é cansativo. É suposto havernão-o-codificadorControle de qualidade do processo de lançamento e testes de regressão completos (e construção, aceitação e lançamento), especialmente. em todas as áreas afetadas pelo código modificado, adicionando novos testes para o novo código! Isso está começando a se parecer com o modelo dos lançamentos da Microsoft e da Apple, onde, uma vez funcionando, não ouso clicar[OK]para atualizar consultas por um medo bem fundado de obter um "problema" de alta prioridade/alta gravidade não rastreável e fatal (sem solução alternativa), desperdiçando mais do meu tempo, em que tenho que fazer o controle de qualidade e testar outra pessoa ignorada.

Não é assim que a liberação é definida pela ACM, IEEE, ISO, SQA, et. al. Tenho que substituir um arquivo não salvo em um sistema que não pode ser conectado, ou seja, reinstalar após zerar.

Responder2

Também encontrei isso, com processadores AMD EPYC 7452 de 32 núcleos:

Aug 28 13:57:40 server01 kernel: [    8.196170] MCE: In-kernel MCE decoding enabled.
Aug 28 13:57:40 server01 kernel: [    8.201319] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 13:57:40 server01 kernel: [    8.201320] EDAC amd64: F17h detected (node 0).
Aug 28 13:57:40 server01 kernel: [    8.201375] EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
Aug 28 13:57:40 server01 kernel: [    8.201378] EDAC amd64: Error: Error probing instance: 0
Aug 28 13:57:40 server01 kernel: [    8.320565] EDAC amd64: Node 0: DRAM ECC enabled.

A correção foi instalar os kernels LTS Enablement Stacks (também chamados de HWE ou Hardware Enablement):

apt install --install-recommends linux-generic-hwe-18.04

Agora, o sistema inicializa com isso e não gera erro:

Aug 28 14:07:39 server01 kernel: [  117.977960] MCE: In-kernel MCE decoding enabled.
Aug 28 14:07:39 server01 kernel: [  117.985049] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 14:07:39 server01 kernel: [  117.985051] EDAC amd64: F17h_M30h detected (node 0).
Aug 28 14:07:39 server01 kernel: [  117.985283] EDAC MC: UMC0 chip selects:
Aug 28 14:07:39 server01 kernel: [  117.985285] EDAC amd64: MC: 0: 65536MB 1: 65536MB
Aug 28 14:07:39 server01 kernel: [  117.985286] EDAC amd64: MC: 2: 65536MB 3: 65536MB

informação relacionada