18.04 Updates unterbrechen Grub und verhindern das Booten

18.04 Updates unterbrechen Grub und verhindern das Booten

Heute ist ein Problem aufgetreten, das den Start meines Systems verhindert hat. Das System ist eine Neuinstallation, da ich Ubuntu 18.04.3 kürzlich über einen Live-USB mit der offiziellen Ubuntu-ISO neu installiert habe.

Dies ist mein dritter oder vierter Versuch und ich habe das gleiche Problem:

  • Installieren Sie das System mit Standardparametern

  • Sofort nach der Installation neu starten, kein Problem.

  • Mein System aktualisieren. Im Moment ist es kaputt, also habe ich es nicht mehr, aber ich habe direkt nach der Installation des Systems die regulären Updates ausgeführt.

  • Nach dem erneuten Neustart scheint mein System defekt zu sein. Ich kann Ubuntu nicht mehr starten. Das System zeigt weiterhin das Grub-Menü an und schlägt dann fehl, wenn ich eine Option auswähle.
  • Jedes Mal, wenn dies passiert, installiere ich Ubuntu 18.04.3 neu und habe das gleiche Problem (Update und stecke in einer Boot-Schleife fest).
  • Wir haben einen von dmesg angezeigten Fehler:
EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
EDAC amd64: Error: Errorprobing instamce: 0

Wir haben diesen Fehler auf einem anderen Computer (Bearbeiten: 3 weitere Computer) mit einer einwöchigen Installation reproduziert und sind auf genau dasselbe Problem gestoßen. Die anderen Computer verfügen über ähnliche, sehr aktuelle Hardware (aktuellste AMD-CPU, AMD Epyc 7302p).

Ein Kollege hat das Update durchgeführt und hatte ebenfalls das Problem. Er musste seine Kernelversion von 5.0.0-36-generic auf 5.0.0-35-generic zurücksetzen, um ein funktionsfähiges System wiederherzustellen.

Aktualisieren:Anscheinend kommt der Fehler von einem Paket-Upgrade. Da ich Ubuntu 18.04 von Grund auf neu installiert habe, von einem Live-USB mit der Kernel-Version 5.0.0-23-generic, und das Installationsprogramm die Updates während der Installation herunterladen ließ, aktualisiert es den Kernel auf Version 5.0.0-36-generic, ohne Grub zu beschädigen. Als ich jedoch versuchte, die anderen Pakete zu aktualisieren (mit apt upgrade), wurde Grub erneut beschädigt.

Während des Upgrades sah ich, dass ein Paket einige Dateien in der /boot-Partition änderte, aber leider hatte ich keine Zeit, nachzusehen, welches Paket.

Hat jemand sonst dieses Problem? Hat jemand eine Lösung?

Antwort1

Dasselbe Problem nach einer Reihe vertrauenswürdiger Updates auf zwei Dell Precision 5820. Das erste hat zwei Betriebssysteme auf separaten 2-TB-Laufwerken:

  • sda=Ubuntu18.04
  • sdb=Windows10

Das zweite hat drei Betriebssysteme auf separaten 2-TB-Laufwerken:

  • sda=Ubuntu18.04
  • sdb=Fedora31
  • sdc=Debian9

Beim ersten habe ich Folgendes ausgeführt:

  1. sudo apt update
  2. Ich habe den Software Updater aufgerufen.
  3. Ich habe zugelassen, dass alles aktualisiert wird.
  4. als ich GRUB aktualisieren wollte, fragte ich, ob ich meinen ersetzen, bei dem lokalen bleiben oder die beiden vergleichen wollte. Ich entschied mich für den Vergleich des lokalen und des neuen, was einfach klang, eine Konsolenanzeige besagteShim-signed (1.37~18.04.3+15+1533136590.3beb971-0ubuntu1) wird eingerichtet …beim Durchführen einiger Updates (obwohl ich NEIN dazu gesagt habe!) und erforderte einen Neustart, um das System freizugeben.
  5. Als ich wieder da war, öffnete ich ein Terminal und führtesudo update-grub
  6. Ich habe noch einmal neu gestartet und bin eingestiegen.

Das zweite System (synchron, da beide von der gestrigen Dell Restore-Flash-Installation liefen, die die „Anmeldeschleife“ überwand, die dadurch verursacht wurde, dass AMD seine Treiber nicht einspielen konnte, bevor Dell die Systemversion einfror, wobei die Grafikkarte 2100X endlos auf Anmeldeeingaben wartete, die im 16.04-Code/Kernel nicht gelesen werden konnten) war anders, weil ich (bei derselben Anfrage zu einem GRUB-Update) sagte, dass ich beim lokalen bleiben wollte, das mir erlaubte, meine drei Betriebssysteme auszuwählen/auszuführen. Nach einem Neustart traten bei allen dreien Fehler auf, was mir sagt, dass GRUB kaputt ist (ebenso wie der Software-Installer-Code).

  • Ubuntu: Früher habe ich F12das GRUB-Menü umgangen und Ubuntu ausgewählt, aber es ist fehlgeschlagen.

    0.3294701 Kernel offset: ...
    0.3294911 --- [ end Kernel panic - not synching: VFS: 
    Unable to mount fs on unknown-block(0,0)
    

    Also habe ich einen Neustart durchgeführt.

  • Debian: Früher habe ich F12das GRUB-Menü umgangen und Debian ausgewählt, aber das hat nicht funktioniert. Es ging zum Systemtester-Fenster, das ich verlassen habe Esc, und habe dann einen Neustart durchgeführt.

  • Fedora: Ich habe F12das GRUB-Menü umgangen und Fedora ausgewählt. Zunächst schien alles in Ordnung zu sein. Ich bin reingekommen und es hat automatisch aktualisiert.
    Dann ging es ins EFI-Menü, wo ich wieder Fedora ausgewählt habe. Es kam zum violetten Ubuntuniedrige AuflösungBildschirm und dort aufgelegt.

Das ist ermüdend. Es sollnicht der ProgrammiererQualitätssicherung des Veröffentlichungsprozesses und vollständige Regressionstests (und Build-, Akzeptanz- und Veröffentlichungstests), insbesondere in allen Bereichen, die von geändertem Code betroffen sind, und Hinzufügen neuer Tests für neuen Code! Dies ähnelt langsam dem Modell der Veröffentlichungen von Microsoft und Apple, bei denen ich mich, wenn es einmal funktioniert, nicht mehr traue, auf[OK]um Abfragen zu aktualisieren, aus der begründeten Angst heraus, dass ein nicht nachvollziehbares und schwerwiegendes (keine Umgehung möglich) „Problem“ mit hoher Priorität/Schweregrad auftritt, das noch mehr meiner Zeit verschwendet, da ich die Qualitätssicherung und die Tests durchführen muss, die jemand anderes übersprungen hat.

Dies entspricht nicht der Definition der Freigabe durch ACM, IEEE, ISO, SQA usw. Ich muss eine nicht gespeicherte Datei auf einem System ersetzen, bei dem keine Anmeldung möglich ist, d. h. nach dem Zurücksetzen auf Null eine Neuinstallation durchführen.

Antwort2

Bei AMD EPYC 7452 32-Core-Prozessoren ist mir Folgendes passiert:

Aug 28 13:57:40 server01 kernel: [    8.196170] MCE: In-kernel MCE decoding enabled.
Aug 28 13:57:40 server01 kernel: [    8.201319] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 13:57:40 server01 kernel: [    8.201320] EDAC amd64: F17h detected (node 0).
Aug 28 13:57:40 server01 kernel: [    8.201375] EDAC amd64: Error: F0 not found, device 0x1460 (broken BIOS?)
Aug 28 13:57:40 server01 kernel: [    8.201378] EDAC amd64: Error: Error probing instance: 0
Aug 28 13:57:40 server01 kernel: [    8.320565] EDAC amd64: Node 0: DRAM ECC enabled.

Die Lösung bestand in der Installation der LTS Enablement Stacks (auch HWE oder Hardware Enablement genannt)-Kernel:

apt install --install-recommends linux-generic-hwe-18.04

Jetzt bootet das System damit und gibt keinen Fehler aus:

Aug 28 14:07:39 server01 kernel: [  117.977960] MCE: In-kernel MCE decoding enabled.
Aug 28 14:07:39 server01 kernel: [  117.985049] EDAC amd64: Node 0: DRAM ECC enabled.
Aug 28 14:07:39 server01 kernel: [  117.985051] EDAC amd64: F17h_M30h detected (node 0).
Aug 28 14:07:39 server01 kernel: [  117.985283] EDAC MC: UMC0 chip selects:
Aug 28 14:07:39 server01 kernel: [  117.985285] EDAC amd64: MC: 0: 65536MB 1: 65536MB
Aug 28 14:07:39 server01 kernel: [  117.985286] EDAC amd64: MC: 2: 65536MB 3: 65536MB

verwandte Informationen