¿Cómo saber por qué la sonda de vida de Kubernetes obtiene HTTP 503 mientras que los registros muestran 200 OK?

Question

Después de profundizar más y más en esto, parece que el demonio Docker estaba matando el contenedor por exceder el límite de memoria registrado en los registros del sistema:

Jan 15 12:12:40 node01 kernel: [2411297.634996] httpd invoked oom-killer: gfp_mask=0x14200ca(GFP_HIGHUSER_MOVABLE), nodemask=(null), order=0, oom_score_adj=998
[...]
Jan 15 12:12:40 node01 kernel: [2411297.672084] oom_reaper: reaped process 519 (httpd), now anon-rss:0kB, file-rss:0kB, shmem-rss:68kB

Por qué httpd repentinamente supera el límite de memoria sigue siendo una pregunta, pero está fuera de alcance aquí.
Por qué Kubernetes no informa que el contenedor se cancela por exceder el límite de memoria (último informe estatal según los documentos) sigue siendo una pregunta para mí.
Los registros probablemente no muestran el resultado de ninguna respuesta 503, porque el demonio Docker elimina el contenedor antes de escribirlo en stdout/stderr.
Todavía no entiendo la secuencia de eventos aquí si la causa es la falta de memoria, porque primero recibe una señal de apagado elegante y kubelet registra la respuesta como 503 (no tiempo de espera).

Incluso si esta es la causa, es una muy mala experiencia de usuario para que el administrador de Kubernetes la busque.

Answer 1

Después de profundizar más y más en esto, parece que el demonio Docker estaba matando el contenedor por exceder el límite de memoria registrado en los registros del sistema:

Jan 15 12:12:40 node01 kernel: [2411297.634996] httpd invoked oom-killer: gfp_mask=0x14200ca(GFP_HIGHUSER_MOVABLE), nodemask=(null), order=0, oom_score_adj=998
[...]
Jan 15 12:12:40 node01 kernel: [2411297.672084] oom_reaper: reaped process 519 (httpd), now anon-rss:0kB, file-rss:0kB, shmem-rss:68kB

Por qué httpd repentinamente supera el límite de memoria sigue siendo una pregunta, pero está fuera de alcance aquí.
Por qué Kubernetes no informa que el contenedor se cancela por exceder el límite de memoria (último informe estatal según los documentos) sigue siendo una pregunta para mí.
Los registros probablemente no muestran el resultado de ninguna respuesta 503, porque el demonio Docker elimina el contenedor antes de escribirlo en stdout/stderr.
Todavía no entiendo la secuencia de eventos aquí si la causa es la falta de memoria, porque primero recibe una señal de apagado elegante y kubelet registra la respuesta como 503 (no tiempo de espera).

Incluso si esta es la causa, es una muy mala experiencia de usuario para que el administrador de Kubernetes la busque.

¿Cómo saber por qué la sonda de vida de Kubernetes obtiene HTTP 503 mientras que los registros muestran 200 OK?

Respuesta1

información relacionada