Las actualizaciones 18.04 interrumpen el grub e impiden el arranque

Las actualizaciones 18.04 interrumpen el grub e impiden el arranque

Hoy encontré un problema que impidió que mi sistema se iniciara. El sistema es una instalación nueva, ya que recientemente reinstalé Ubuntu 18.04.3 a través de un USB en vivo con la ISO oficial de Ubuntu.

Este es mi tercer o cuarto intento y estoy experimentando el mismo problema:

  • Instalar el sistema con parámetros predeterminados.

  • Reinicie inmediatamente después de la instalación, no hay problema.

  • Actualizar mi sistema. En este momento está roto, así que ya no lo tengo, pero ejecuté las actualizaciones periódicas inmediatamente después de instalar el sistema.

  • Después de reiniciar nuevamente, mi sistema parece roto. Ya no puedo iniciar Ubuntu. El sistema continúa mostrando el menú de grub y luego falla si selecciono alguna opción.
  • Cada vez que esto sucede, reinstalo Ubuntu 18.04.3 y tengo el mismo problema (actualizo y me quedo atascado en un bucle de arranque).
  • Tenemos un error mostrado por dmesg:
EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
EDAC amd64: Error: Errorprobing instamce: 0

Reprodujimos este error con otra computadora (editar: otras 3 computadoras) con una instalación de hace una semana y nos encontramos exactamente con el mismo problema. Las otras computadoras tienen hardware similar muy reciente (CPU AMD más reciente, AMD Epyc 7302p).

Un colega realizó la actualización y también tuvo el problema. Tuvo que revertir la versión de su kernel de 5.0.0-36-generic a 5.0.0-35-generic para recuperar un sistema funcional.

Actualizar:Aparentemente, el error proviene de una actualización del paquete. Porque instalé Ubuntu 18.04 desde cero, desde un USB en vivo con la versión del kernel 5.0.0-23-generic y al dejar que el instalador descargue las actualizaciones durante la instalación, actualiza el kernel a la versión 5.0.0-36-generic sin romperse la comida. Sin embargo, cuando intenté actualizar los otros paquetes (con apt Upgrade), el grub volvió a romperse.

Durante la actualización, vi que un paquete estaba modificando algunos archivos en la partición /boot pero, desafortunadamente, no tuve tiempo de ver cuál.

¿Alguien más ha tenido este problema? ¿Alguien tiene una solución?

Respuesta1

El mismo problema después de una serie de actualizaciones confiables en dos Dell Precision 5820. El primero tiene dos sistemas operativos en unidades independientes de 2 TB:

  • sda=Ubuntu18.04
  • sdb=Windows10

El segundo tiene tres sistemas operativos en unidades independientes de 2 TB:

  • sda=Ubuntu18.04
  • sdb=Fedora31
  • sdc=Debian9

En el primero ejecuté lo siguiente:

  1. sudo apt update
  2. Invoqué el Actualizador de software.
  3. Le permití actualizar todo.
  4. cuando llegó el momento de actualizar GRUB, me preguntó si quería reemplazar el mío, quedarme con el local o comparar los dos. Elegí comparar lo local y lo nuevo, lo que sonaba simple: una lectura en la consola que decíaConfigurando shim-signed (1.37~18.04.3+15+1533136590.3beb971-0ubuntu1) ...al realizar alguna actualización (¡aunque dije NO a hacerlo!) y requirió reiniciar para liberar el sistema.
  5. Cuando regresé, abrí una terminal y ejecutésudo update-grub
  6. Reinicié de nuevo y entré.

El segundo sistema (en sincronización ya que ambos se ejecutaron desde la instalación flash Dell Restore de ayer que superó el "bucle de inicio de sesión" causado por que AMD no instaló sus controladores antes de que Dell congelara el lanzamiento del sistema con la tarjeta gráfica 2100X esperando interminablemente una entrada de inicio de sesión que no se podía leer). en código/kernel 16.04) fue diferente porque dije (en la misma consulta sobre una actualización de GRUB) que quería quedarme con el local que me permitía seleccionar/ejecutar mis tres sistemas operativos. Después de reiniciar, me dio errores en los tres, lo que me dice que GRUB no funciona (al igual que el código del instalador de software).

  • Ubuntu: solía F12omitir el menú de GRUB y seleccioné Ubuntu pero falló.

    0.3294701 Kernel offset: ...
    0.3294911 --- [ end Kernel panic - not synching: VFS: 
    Unable to mount fs on unknown-block(0,0)
    

    Entonces reinicié.

  • Debian: solía F12omitir el menú de GRUB y seleccioné Debian, pero falló. Fue a la ventana del Probador del sistema, que presioné Escpara salir, y luego reinicié.

  • Fedora: Solía F12​​omitir el menú de GRUB y seleccioné Fedora. Al principio parecía estar bien. Entré y se actualizó automáticamente.
    Luego, entró en el menú EFI, donde nuevamente seleccioné Fedora. Llegó al Ubuntu moradobaja resoluciónpantalla y colgué allí.

Esto es agotador. Se supone que debe haberno el codificadorControl de calidad del proceso de lanzamiento y pruebas de regresión completa (y compilación, aceptación y lanzamiento), especialmente. en todas las áreas afectadas por el código modificado, agregando nuevas pruebas para el código nuevo. Esto está empezando a parecerse al modelo de los lanzamientos de Microsoft y Apple, donde una vez que está funcionando, no me atrevo a hacer clic nunca.[De acuerdo]para actualizar consultas por un temor fundado de tener un "problema" de alta prioridad/alta gravedad imposible de rastrear y fatal (sin solución alternativa), que me haga perder más tiempo, en el que tengo que hacer el control de calidad y omitir las pruebas de otra persona.

No es así como ACM, IEEE, ISO, SQA, etc. definen la liberación. Alabama. Tengo que reemplazar un archivo no guardado en un sistema en el que no se puede iniciar sesión, es decir, reinstalarlo después de ponerlo a cero.

Respuesta2

También me encontré con esto, con los procesadores AMD EPYC 7452 de 32 núcleos:

Aug 28 13:57:40 server01 kernel: [    8.196170] MCE: In-kernel MCE decoding enabled.
Aug 28 13:57:40 server01 kernel: [    8.201319] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 13:57:40 server01 kernel: [    8.201320] EDAC amd64: F17h detected (node 0).
Aug 28 13:57:40 server01 kernel: [    8.201375] EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
Aug 28 13:57:40 server01 kernel: [    8.201378] EDAC amd64: Error: Error probing instance: 0
Aug 28 13:57:40 server01 kernel: [    8.320565] EDAC amd64: Node 0: DRAM ECC enabled.

La solución fue instalar los kernels LTS Enablement Stacks (también llamados HWE o Hardware Enablement):

apt install --install-recommends linux-generic-hwe-18.04

Ahora, el sistema arranca con esto y no arroja ningún error:

Aug 28 14:07:39 server01 kernel: [  117.977960] MCE: In-kernel MCE decoding enabled.
Aug 28 14:07:39 server01 kernel: [  117.985049] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 14:07:39 server01 kernel: [  117.985051] EDAC amd64: F17h_M30h detected (node 0).
Aug 28 14:07:39 server01 kernel: [  117.985283] EDAC MC: UMC0 chip selects:
Aug 28 14:07:39 server01 kernel: [  117.985285] EDAC amd64: MC: 0: 65536MB 1: 65536MB
Aug 28 14:07:39 server01 kernel: [  117.985286] EDAC amd64: MC: 2: 65536MB 3: 65536MB

información relacionada