В настоящее время я столкнулся с проблемой, когда одна из наших виртуальных машин Proxmox, работающая на Debian 11, страдает от очень внезапных перегрузок ЦП. Это уже случалось на прошлой неделе и снова сегодня. Когда это происходит, сервер полностью не отвечает. Мы даже не можем получить к нему доступ через консоль Proxmox, так как он не принимает никаких входных данных. Вот как выглядит график ЦП (средний):
Использование памяти, сети или диска не показывает никаких внезапных скачков, когда это происходит. Это просто загрузка ЦП. У виртуальной машины два виртуальных ядра, поэтому я предполагаю, что проблема заключается в одноядерном приложении.
VM используется для нескольких проектов клиентов в качестве промежуточной среды. Работает несколько приложений, включая PostgreSQL, Node.js и PHP. На машине запущен агент New Relic, и мы проверили историю процесса:
Как вы можете видеть, виновником, похоже, является какое-то приложение Node.js. Однако затронутый процесс не показывает никаких подробностей. Теперь проблема в следующем: как нам это диагностировать? На машине через PM2 запущено несколько приложений Node.js. Поскольку мы не можем получить доступ к консоли Proxmox или SSH на машине, когда это происходит, мы не можем проверить список процессов PM2 прямо в тот момент, когда это происходит. Мы проверили различные журналы в /var/log
, но не смогли найти ничего, связанного с этим.
Есть идеи?