Zufällige Kernel-Panik nach der Neuinstallation von Arch Linux

Zufällige Kernel-Panik nach der Neuinstallation von Arch Linux

Bei mir sind kürzlich zwei Festplatten in einem RAID 5-Array abgestürzt. Ich hatte keine Überwachung konfiguriert und bemerkte deshalb nicht, dass eine davon schon eine Weile abgestürzt war. Also beschloss ich, alles wegzuwerfen und von vorne anzufangen.

Die gesamte Hardware ist die gleiche wie vorher, außer dass ich weniger Laufwerke als vorher in meinem Array habe, 3 größere statt 8. Ich habe außerdem Arch Linux als UEFI installiert, statt die Legacy-Boot-Option zu verwenden, bin mir nicht sicher, ob das irgendwelche Auswirkungen hat.

Ich habe Arch Linux neu installiert, mit entsprechender Mdadm-Überwachung/-Benachrichtigungen und täglichen kurzen SMART-Tests (und wöchentlichen langen Tests).

Seit der Neuinstallation von Arch Linux kommt es jedoch zu gelegentlichen Kernel-Panics, normalerweise nach einer Betriebszeit von mehr als 48 Stunden.

Mir ist es gelungen, ein Bild von der Kernel-Panic zu machen:

Kernel-Panik-Bild

Soweit ich es erkennen kann, scheint es mit mdadm zusammenzuhängen.

Hier ist meine mdadm-Konfiguration:

Personalities : [raid1] [raid6] [raid5] [raid4]
md0 : active raid1 sda1[0] sdb1[1]
      524224 blocks super 1.0 [2/2] [UU]

md1 : active raid1 sda3[0] sdb3[1]
      1950761024 blocks super 1.2 [2/2] [UU]
      bitmap: 5/15 pages [20KB], 65536KB chunk

md2 : active raid5 sde1[3] sdc1[0] sdd1[1]
      5796265984 blocks super 1.2 level 5, 512k chunk, algorithm 2 [3/3] [UUU]
      bitmap: 0/22 pages [0KB], 65536KB chunk

unused devices: <none>

Relevante Zeile in mkinitcpio.conf:

HOOKS="base udev autodetect modconf block mdadm_udev filesystems keyboard fsck"

Ich verwende derzeit Linux akatosh 4.1.6-1-ARCH #1 SMP PREEMPT Mon Aug 17 08:52:28 CEST 2015 x86_64 GNU/Linux.

Ich habe versucht, meinen RAM neu einzusetzen, aber ich bezweifle, dass es ein RAM-Problem ist, da dies nicht auftrat, bevor ich Arch Linux neu installiert habe.

Die meisten Kernel-Panic-Probleme, die ich bei meinen Recherchen im Zusammenhang mit mdadm gefunden habe, traten beim Booten auf. Hat jemand eine Ahnung, was das Problem sein könnte?

BEARBEITEN: Dies scheint ein bekannter Fehler zu sein, der in 4.1.4 oder 4.1.5 eingeführt wurde:https://bugzilla.redhat.com/show_bug.cgi?id=1255509

Ich werde beim Testen versuchen, auf 4.2.0 zu aktualisieren und diesen Beitrag mit weiteren Informationen aktualisieren.

Antwort1

Dies ist ein bekannter Fehler, der durch Folgendes verursacht wurde:

edbe83ab4c27 md/raid5: allow the stripe_cache to grow and shrink.

Weitere Informationen erhalten Siegefunden in diesem offiziellen Fehlerbericht: „Fehler 1255509 – BUG: Kernel-Paging-Anforderung bei ffffffffffffffd8 kann nicht verarbeitet werden.“

Die Lösung besteht darin, auf 4.2.0 zu aktualisieren.

verwandte Informationen