rcu_sched が CPU の停止を検出しました

Question

スタックから、この CPU がメモリを割り当てようとしているときにスピンロックに陥っていることがわかります (_raw_spin_lock内部alloc_vmap_area)。さらに興味深いのは、新しいモジュール ( ) をロードしようとしているときにこれが起こっているようです。新しいsys_init_moduleモジュールは、モジュールの初期化コードを呼び出すだけです (ポインタジャンプを介して、これがスタックトレースに表示されない理由です)。

これは、このモジュールをロードするときに発生するカーネルバグか、モジュール自体のバグである可能性が非常に高いことを意味します (おそらく後者は、vmalloc基礎となるモジュールによって呼び出される可能性が高いため)。

このバグの原因となっているモジュールを見つける必要があります。この問題が発生したときに D 状態でスタックしているプロセスを確認するか、eBPF などを使用してモジュール初期化への新しい呼び出しをトレースします。

Answer 1

スタックから、この CPU がメモリを割り当てようとしているときにスピンロックに陥っていることがわかります (_raw_spin_lock内部alloc_vmap_area)。さらに興味深いのは、新しいモジュール ( ) をロードしようとしているときにこれが起こっているようです。新しいsys_init_moduleモジュールは、モジュールの初期化コードを呼び出すだけです (ポインタジャンプを介して、これがスタックトレースに表示されない理由です)。

これは、このモジュールをロードするときに発生するカーネルバグか、モジュール自体のバグである可能性が非常に高いことを意味します (おそらく後者は、vmalloc基礎となるモジュールによって呼び出される可能性が高いため)。

このバグの原因となっているモジュールを見つける必要があります。この問題が発生したときに D 状態でスタックしているプロセスを確認するか、eBPF などを使用してモジュール初期化への新しい呼び出しをトレースします。

rcu_sched が CPU の停止を検出しました

答え1

関連情報