Масштабирование на основе количества процессов, запущенных на экземпляре ec2

2024-6-27 • tag-icon

Масштабирование на основе количества процессов, запущенных на экземпляре ec2

У меня есть вариант использования, в котором несколько скриптов Python будут работать параллельно на ec2. Они считывают очередь SQS и выполняют такие операции, как загрузка из S3, разбор файлов, разделение, обработка и обновление базы данных. Скрипты запускаются каждые 5 минут. Если SQS пуст, скрипт ничего не делает и завершает работу. Если в SQS есть сообщение, оно обрабатывается скриптом, который может работать более часа. Поэтому длительность выполнения варьируется.

В автоматическом масштабировании я вижу возможность масштабирования на основе средней загрузки ЦП, но случайность, с которой используется ЦП, делает его не лучшим индикатором, когда следует масштабировать (например, скрипт Python будет потреблять больше ресурсов ЦП при выполнении операций ввода-вывода с диска. Но в других случаях он потребляет память, но не ЦП).

Есть ли способ масштабирования на основе количества процессов python, запущенных на экземпляре ec2? Так, чтобы когда количество параллельных вызовов достигло 10, экземпляры масштабировались?

Кроме того, есть ли способ указать, что уменьшение масштаба должно бытьНЕТпроизойдет для экземпляра ec2, если внутри него запущен хотя бы один процесс python (даже если этот процесс потребляет <5% ресурсов процессора), поскольку уменьшение масштаба завершит текущий процесс, и было бы лучше, если бы уменьшение масштаба могло произойти после завершения процесса python.

На рисунке нет балансировщика нагрузки.

Связанный контент