rcu_sched hat einen CPU-Stall erkannt

Question

Aus dem Stapel können wir erkennen, dass diese CPU in einem Spinlock feststeckt, während sie versucht, Speicher zuzuweisen ( _raw_spin_lockinnerhalb von alloc_vmap_area). Interessanter ist, dass dies anscheinend beim Versuch passiert, ein neues Modul zu laden ( sys_init_module), das lediglich den Initialisierungscode des Moduls aufruft (durch einen Zeigersprung, weshalb Sie es nicht im Stapelüberwachungsprotokoll sehen).

Dies bedeutet, dass es sich höchstwahrscheinlich entweder um einen Kernelfehler handelt, der beim Laden dieses Moduls auftritt, oder um einen Fehler im Modul selbst (wahrscheinlich letzteres, da es mit vmallocziemlicher Sicherheit vom zugrunde liegenden Modul aufgerufen wird).

Sie müssen das Modul finden, das für diesen Fehler verantwortlich ist. Sehen Sie sich die Prozesse an, die im Zustand D hängen bleiben, wenn dies geschieht, oder verwenden Sie etwas wie eBPF, um neue Aufrufe der Modulinitialisierung zu verfolgen.

Answer 1

Aus dem Stapel können wir erkennen, dass diese CPU in einem Spinlock feststeckt, während sie versucht, Speicher zuzuweisen ( _raw_spin_lockinnerhalb von alloc_vmap_area). Interessanter ist, dass dies anscheinend beim Versuch passiert, ein neues Modul zu laden ( sys_init_module), das lediglich den Initialisierungscode des Moduls aufruft (durch einen Zeigersprung, weshalb Sie es nicht im Stapelüberwachungsprotokoll sehen).

Dies bedeutet, dass es sich höchstwahrscheinlich entweder um einen Kernelfehler handelt, der beim Laden dieses Moduls auftritt, oder um einen Fehler im Modul selbst (wahrscheinlich letzteres, da es mit vmallocziemlicher Sicherheit vom zugrunde liegenden Modul aufgerufen wird).

Sie müssen das Modul finden, das für diesen Fehler verantwortlich ist. Sehen Sie sich die Prozesse an, die im Zustand D hängen bleiben, wenn dies geschieht, oder verwenden Sie etwas wie eBPF, um neue Aufrufe der Modulinitialisierung zu verfolgen.

rcu_sched hat einen CPU-Stall erkannt

Antwort1

verwandte Informationen