Como devo distribuir a carga de tráfego de saída de um único servidor para vários servidores?

Como devo distribuir a carga de tráfego de saída de um único servidor para vários servidores?

Eu tenho um aplicativo rodando em um VPS.

Meu servidor envia solicitações HTTP para uma API externa com uma taxa muito alta. Isso fez com que eu excedesse o limite de tráfego de saída do meu provedor.

Minha pesquisa na internet me forneceu muitas informações sobre como equilibrar o tráfego de entrada, mas meu problema é o tráfego de saída, sobre o qual encontrei informações mínimas, nenhuma das quais consegui correlacionar com a minha situação.

Comprar um servidor dedicado, para ter uma largura de banda maior, não é acessível para mim (pelo menos até que o aplicativo se torne lucrativo o suficiente, o que exige que ele seja ampliado primeiro, daí o meu problema).

A abordagem a seguir resolveria meu problema?

Mantenho meu servidor atual, mas modifico o programa para que, em vez de realizar as solicitações HTTP de saída, ele crie uma fila, contendo os dados que utilizo para formar cada uma. Também recebo alguns VPSs menores, cujo trabalho é verificar de forma independente e intermitente se alguma solicitação está pendente na fila dos servidores principais. Caso haja uma solicitação pendente a ser executada, ele utiliza os dados da fila para formar e enviar a solicitação correspondente e por fim quando for recebida uma resposta da API externa, envia a resposta HTTP ao servidor principal.

Observação: minhas solicitações HTTP passam por um serviço de proxy externo, que adiciona sobrecarga a cada solicitação. Conselhos sobre como minimizar o tamanho das solicitações também podem ser úteis.

É a primeira vez que implanto um aplicativo com alto tráfego e meu conhecimento mínimo de redes não ajuda. Qualquer contribuição seria muito apreciada.

informação relacionada