Um Ihnen etwas Kontext zu geben:

Question

Ich poste dies Community Wiki, damit es für die Community besser sichtbar ist.

Leider verfüge ich nicht über alle Informationen, um dieses Szenario genau zu reproduzieren (Anwendungsdesign, Art und Weise der Testausführung, Umgebung usw.). Basierend auf dem Kommentar des OP gilt jedoch:

Es stellt sich heraus, dass Multitasking bei Kubernetes auf Pod-Ebene erfolgt. Anstatt einen großen Pod mit vielen Threads zu haben, können Sie viele kleinere Pods laufen lassen. Sie könnten mit diesem Wechsel experimentieren.

Es sieht so aus, als ob OP in seinem GKECluster verwendet hatHPAmit CPUundAutomatische Skalierung von Clusternähnliche Lösung, die beschrieben wurde inApp Engine Flex || Kubernetes Engine — ?Artikel.

Wichtig zu erwähnen ist, dass vieles davon abhängtSkalierungsarten.

Answer 1

Ich poste dies Community Wiki, damit es für die Community besser sichtbar ist.

Leider verfüge ich nicht über alle Informationen, um dieses Szenario genau zu reproduzieren (Anwendungsdesign, Art und Weise der Testausführung, Umgebung usw.). Basierend auf dem Kommentar des OP gilt jedoch:

Es stellt sich heraus, dass Multitasking bei Kubernetes auf Pod-Ebene erfolgt. Anstatt einen großen Pod mit vielen Threads zu haben, können Sie viele kleinere Pods laufen lassen. Sie könnten mit diesem Wechsel experimentieren.

Es sieht so aus, als ob OP in seinem GKECluster verwendet hatHPAmit CPUundAutomatische Skalierung von Clusternähnliche Lösung, die beschrieben wurde inApp Engine Flex || Kubernetes Engine — ?Artikel.

Wichtig zu erwähnen ist, dass vieles davon abhängtSkalierungsarten.

Um Ihnen etwas Kontext zu geben:

Um Ihnen etwas Kontext zu geben:

Parallelität

Kubernetes-Antwort-Wasserfall

Wasserfall für App Engine-Antworten

Gunicorn-Konfiguration

Antwort1

verwandte Informationen