O servidor AWS trava. O tempo roubado pode causar isso?

O servidor AWS trava. O tempo roubado pode causar isso?

No trabalho, temos dois ambientes perfilados com nova relíquia. Implantamos os mesmos contêineres docker para desenvolvimento e produção. O interessante é que, embora o desenvolvedor não esteja tendo problemas, o site de produção continua inoperante.

A diferença entre os dois ambientes é que o dev não perde tempo em seus servidores aws, enquanto a produção sim. Vemos um aumento no tempo de CPU roubado logo antes do servidor node.js travar.

Pelo que li, o processo deveria apenas esperar, mas existem cenários em que esse tempo roubado irá realmente travar o servidor?

informação relacionada