Para darle un poco de contexto:

Question

Publicar esto Community Wikipara una mejor visibilidad para la comunidad.

Desafortunadamente, no tengo toda la información para reproducir exactamente este escenario (diseño de la aplicación, cómo se ejecutaron las pruebas, entorno, etc.). Sin embargo, según el comentario de OP:

Resulta que con Kubernetes, la multitarea está al nivel del pod. En lugar de tener un pod grande con muchos subprocesos, puede tener muchos pods más pequeños ejecutándose. Podrías experimentar con ese interruptor.

Parece que OP en su GKEclúster usóHPAcon CPUyEscalado automático de clústersolución similar que se describió enAplicación Engine Flex || ¿Motor Kubernetes?artículo.

Lo importante que vale la pena mencionar es que muchos dependen detipos de escala.

Answer 1

Publicar esto Community Wikipara una mejor visibilidad para la comunidad.

Desafortunadamente, no tengo toda la información para reproducir exactamente este escenario (diseño de la aplicación, cómo se ejecutaron las pruebas, entorno, etc.). Sin embargo, según el comentario de OP:

Resulta que con Kubernetes, la multitarea está al nivel del pod. En lugar de tener un pod grande con muchos subprocesos, puede tener muchos pods más pequeños ejecutándose. Podrías experimentar con ese interruptor.

Parece que OP en su GKEclúster usóHPAcon CPUyEscalado automático de clústersolución similar que se describió enAplicación Engine Flex || ¿Motor Kubernetes?artículo.

Lo importante que vale la pena mencionar es que muchos dependen detipos de escala.

Para darle un poco de contexto:

Para darle un poco de contexto:

concurrencia

Cascada de respuesta de Kubernetes

Cascada de respuesta de App Engine

Configuración de Gunicorn

Respuesta1

información relacionada