Como saber por que a investigação de atividade do Kubernetes obtém HTTP 503 enquanto os logs mostram 200 OK?

Question

Depois de investigar isso cada vez mais, parece que o daemon do Docker estava eliminando o contêiner por ultrapassar o limite de memória registrado nos logs do sistema:

Jan 15 12:12:40 node01 kernel: [2411297.634996] httpd invoked oom-killer: gfp_mask=0x14200ca(GFP_HIGHUSER_MOVABLE), nodemask=(null), order=0, oom_score_adj=998
[...]
Jan 15 12:12:40 node01 kernel: [2411297.672084] oom_reaper: reaped process 519 (httpd), now anon-rss:0kB, file-rss:0kB, shmem-rss:68kB

Por que o httpd repentinamente ultrapassa o limite de memória permanece uma questão, mas está fora do escopo aqui.
Por que o Kubernetes não relata que o contêiner foi eliminado por ultrapassar o limite de memória (relatório lastState conforme documentos) continua sendo uma pergunta para mim.
Os logs provavelmente não mostram a saída de nenhuma resposta 503, porque o contêiner é eliminado pelo daemon do Docker antes de ser gravado em stdout/stderr.
Ainda não consigo entender a sequência de eventos aqui se a causa for falta de memória, porque ele recebe primeiro um sinal de desligamento normal e a resposta é registrada como 503 pelo kubelet (não tempo limite).

Mesmo que essa seja a causa, é uma experiência de usuário muito ruim para o administrador do Kubernetes caçá-la.

Answer 1

Depois de investigar isso cada vez mais, parece que o daemon do Docker estava eliminando o contêiner por ultrapassar o limite de memória registrado nos logs do sistema:

Jan 15 12:12:40 node01 kernel: [2411297.634996] httpd invoked oom-killer: gfp_mask=0x14200ca(GFP_HIGHUSER_MOVABLE), nodemask=(null), order=0, oom_score_adj=998
[...]
Jan 15 12:12:40 node01 kernel: [2411297.672084] oom_reaper: reaped process 519 (httpd), now anon-rss:0kB, file-rss:0kB, shmem-rss:68kB

Por que o httpd repentinamente ultrapassa o limite de memória permanece uma questão, mas está fora do escopo aqui.
Por que o Kubernetes não relata que o contêiner foi eliminado por ultrapassar o limite de memória (relatório lastState conforme documentos) continua sendo uma pergunta para mim.
Os logs provavelmente não mostram a saída de nenhuma resposta 503, porque o contêiner é eliminado pelo daemon do Docker antes de ser gravado em stdout/stderr.
Ainda não consigo entender a sequência de eventos aqui se a causa for falta de memória, porque ele recebe primeiro um sinal de desligamento normal e a resposta é registrada como 503 pelo kubelet (não tempo limite).

Mesmo que essa seja a causa, é uma experiência de usuário muito ruim para o administrador do Kubernetes caçá-la.

Como saber por que a investigação de atividade do Kubernetes obtém HTTP 503 enquanto os logs mostram 200 OK?

Responder1

informação relacionada