Чтобы дать вам некоторый контекст:

Question

Публикую это Community Wikiдля лучшей видимости для сообщества.

К сожалению, у меня нет всей информации, чтобы точно воспроизвести этот сценарий (дизайн приложения, как проводились тесты, окружающая среда и т. д.). Однако, основываясь на комментарии OP:

Оказывается, в Kubernetes многозадачность находится на уровне пода. Вместо того, чтобы иметь один большой под со множеством потоков, вы можете иметь много меньших подов, работающих. Вы можете поэкспериментировать с этим переключением.

Похоже, что ОП в своем GKEкластере использовалHPAс CPUиАвтомасштабирование кластерааналогичное решение, которое было описано вApp Engine Flex || Kubernetes Engine — ?статья.

Важно отметить, что многое зависит оттипы масштабирования.

Answer 1

Публикую это Community Wikiдля лучшей видимости для сообщества.

К сожалению, у меня нет всей информации, чтобы точно воспроизвести этот сценарий (дизайн приложения, как проводились тесты, окружающая среда и т. д.). Однако, основываясь на комментарии OP:

Оказывается, в Kubernetes многозадачность находится на уровне пода. Вместо того, чтобы иметь один большой под со множеством потоков, вы можете иметь много меньших подов, работающих. Вы можете поэкспериментировать с этим переключением.

Похоже, что ОП в своем GKEкластере использовалHPAс CPUиАвтомасштабирование кластерааналогичное решение, которое было описано вApp Engine Flex || Kubernetes Engine — ?статья.

Важно отметить, что многое зависит оттипы масштабирования.

Чтобы дать вам некоторый контекст:

Чтобы дать вам некоторый контекст:

Параллелизм

Водопад ответов Kubernetes

Водопад ответов App Engine

Конфигурация Gunicorn

решение1

Связанный контент