¿Cómo cargo el equilibrio en función de las conexiones backend en AWS?

¿Cómo cargo el equilibrio en función de las conexiones backend en AWS?

Estoy intentando configurar una nube híbrida con AWS como puerta de enlace principal.

Para ahorrar dinero, quiero dirigir todo el tráfico hasta 1000 conexiones a las instalaciones y el resto a los servidores de AWS. ¿Cómo puedo hacer eso de manera escalable en AWS?

Hasta donde puedo decir, ni los balanceadores de carga de aplicaciones ni de red admiten esto ni los grupos objetivo. Sólo se equilibran las Solicitudes ponderadas o menos pendientes.

¿Existe un nombre para este tipo de equilibrio de carga?

información relacionada