
我們最近在我們的產品伺服器中遇到了2 個應用程式的高CPU 使用率(即一個應用程式使用了900% cpu,第二個應用程式使用了700% cpu),並且還注意到平均負載為22 、17、10,因此我們將CPU 資源從12 增加到24 核心。現在我們仍然看到明顯高的平均負載17 15 10但總的來說CPU使用率非常低(即4%/)。
注意:1.當我們的 Prod 伺服器上的平均負載較高時,我們的 UI 搜尋引擎需要很長時間才能獲取請求的資訊。 2.我們還遇到了 I/O 速度(特別是磁碟寫入速度)從 700MB/s 急劇降低到 4.8MB/s。當平均負載較高時,我們經常會看到以下錯誤。
錯誤:來自 syslogd@nabu 於 11 月 2 日 19:06:21 發出的訊息...核心:NMI 看門狗:BUG:軟鎖定 - CPU#0 卡住了 22 秒! [kworker/0:2:17931]
來自 syslogd@nabu 的訊息,於 11 月 2 日 19:06:49 ... 核心:NMI 看門狗:BUG:軟鎖定 - CPU#0 卡住了 22 秒! [kworker/0:2:17931]
來自 syslogd@nabu 於 11 月 2 日 19:07:18 發出的訊息...核心:NMI 看門狗:BUG:軟鎖定 - CPU#0 卡住了 22 秒! [kworker/0:2:17931]
非常感謝這裡的幫忙。