Informações adicionais em resposta aos comentários

Question 1

"Bloqueado", no caso de hung_task_timeout_secssignifica que uma tarefa esteve no estado ininterrupto D por tanto tempo. 120 segundos é uma quantidade extraordinária de tempo para realizar E/S.

Comece o monitoramento que pode obter métricas deste host.dados de redeé bom para isso, pois coleta muitas coisas a cada segundo na memória, portanto, não há muita E/S de disco. E tem bons gráficos.

Revise a latência do disco, como com arquivos iostat -xz 1. Esperas acima de ms de um dígito não são boas. Compartilhe o que é esse armazenamento, fusos, estado sólido, SAN LUNs.

Em relação à rotação e fixação, suspeito que você esteja forçando o agendador a morrer de fome. Compartilhe o modelo específico de CPU em questão e quais núcleos você está fixando para fazer o quê. Como é LockSupport.parkNanos()implementado?

Análise vmstat 1. Ter constantemente muitas tarefas em execução r ou bem estado ininterrupto não é bom.

Considere instalar o BPF e usar scripts para coletar diagnósticos de tarefas.runqslowermostrará tarefas em espera acima de um determinado limite. Muito rápido é o ideal, observe que as unidades de limite são microssegundos.

Recuando um minuto, considere o design desta coisa.

Qual é exatamente a meta de latência, fazendo o quê e com que rapidez?

Existe uma razão pela qual o postgres está sendo executado no mesmo host? Se fosse remoto e acessado via TCP, sua E/S não seria um problema para a aplicação JVM.

Answer

"Bloqueado", no caso de hung_task_timeout_secssignifica que uma tarefa esteve no estado ininterrupto D por tanto tempo. 120 segundos é uma quantidade extraordinária de tempo para realizar E/S.

Comece o monitoramento que pode obter métricas deste host.dados de redeé bom para isso, pois coleta muitas coisas a cada segundo na memória, portanto, não há muita E/S de disco. E tem bons gráficos.

Revise a latência do disco, como com arquivos iostat -xz 1. Esperas acima de ms de um dígito não são boas. Compartilhe o que é esse armazenamento, fusos, estado sólido, SAN LUNs.

Em relação à rotação e fixação, suspeito que você esteja forçando o agendador a morrer de fome. Compartilhe o modelo específico de CPU em questão e quais núcleos você está fixando para fazer o quê. Como é LockSupport.parkNanos()implementado?

Análise vmstat 1. Ter constantemente muitas tarefas em execução r ou bem estado ininterrupto não é bom.

Considere instalar o BPF e usar scripts para coletar diagnósticos de tarefas.runqslowermostrará tarefas em espera acima de um determinado limite. Muito rápido é o ideal, observe que as unidades de limite são microssegundos.

Recuando um minuto, considere o design desta coisa.

Qual é exatamente a meta de latência, fazendo o quê e com que rapidez?

Existe uma razão pela qual o postgres está sendo executado no mesmo host? Se fosse remoto e acessado via TCP, sua E/S não seria um problema para a aplicação JVM.

Question 2

Ok, então no final o problema era bem simples. Meu teste isolado nunca conseguiu travar a máquina porque estava faltando esse elemento em meu código de teste. O problema não tem nada a ver com memória compartilhada ou fixação de núcleo em si. Acontece que o isolamento dos núcleos reduziu ligeiramente o recurso compartilhado disponível a ponto de o agendador poder morrer de fome, porque ...

Ambas as JVMs foram definidas com prioridade em tempo real usando

sudo renice -n -20 $!
sudo chrt -r -a -p 99 $!

Toda a JVM foi atingida, totalizando quase 300 threads com prioridade máxima. Troca de contexto acima de 150.000/s, mesmo com utilização relativamente baixa da CPU.

Deixamos a gentileza e removemos a mudança em tempo real. Isso parece ter resolvido o problema. O objetivo original da configuração RT legada pode ser alcançado alterando a forma como movimentamos/fixamos/estados-c/estados-p, etc.

Answer

Ok, então no final o problema era bem simples. Meu teste isolado nunca conseguiu travar a máquina porque estava faltando esse elemento em meu código de teste. O problema não tem nada a ver com memória compartilhada ou fixação de núcleo em si. Acontece que o isolamento dos núcleos reduziu ligeiramente o recurso compartilhado disponível a ponto de o agendador poder morrer de fome, porque ...

Ambas as JVMs foram definidas com prioridade em tempo real usando

sudo renice -n -20 $!
sudo chrt -r -a -p 99 $!

Toda a JVM foi atingida, totalizando quase 300 threads com prioridade máxima. Troca de contexto acima de 150.000/s, mesmo com utilização relativamente baixa da CPU.

Deixamos a gentileza e removemos a mudança em tempo real. Isso parece ter resolvido o problema. O objetivo original da configuração RT legada pode ser alcançado alterando a forma como movimentamos/fixamos/estados-c/estados-p, etc.

Informações adicionais em resposta aos comentários

Informações adicionais em resposta aos comentários

Responder1

Responder2

informação relacionada