Conselhos de arquitetura AWS - múltiplas instâncias EC2 com banco de dados/sistema de arquivos compartilhado com início e parada dinâmicos

Question 1

Sua configuração parece razoável. Posso sugerir que você procure um API Gateway para "hospedar" sua API e pense um pouco se funciona para você. Você também pode considerar ter suas instâncias do EC2 de carga pesada em um grupo de escalonamento automático e fazer com que seu Lambda de controle interaja com ele, em vez de diretamente com as instâncias.

S3 e EFS são soluções diferentes de armazenamento de dados. S3 é armazenamento de objetos, enquanto EFS é armazenamento de arquivos. O S3 não é exatamente montável, embora possa ser apresentado como se fosse por meio de diferentes utilitários. Quer sejacorretousar S3 ou EFS depende de como você está usando os arquivos que possui.

Para o seu banco de dados, você pode considerar usar o RDS, talvez usando uma classe de instância expansível ou uma das opções sem servidor. Mas isso dependerá do seu orçamento e caso de uso.

Answer

Sua configuração parece razoável. Posso sugerir que você procure um API Gateway para "hospedar" sua API e pense um pouco se funciona para você. Você também pode considerar ter suas instâncias do EC2 de carga pesada em um grupo de escalonamento automático e fazer com que seu Lambda de controle interaja com ele, em vez de diretamente com as instâncias.

S3 e EFS são soluções diferentes de armazenamento de dados. S3 é armazenamento de objetos, enquanto EFS é armazenamento de arquivos. O S3 não é exatamente montável, embora possa ser apresentado como se fosse por meio de diferentes utilitários. Quer sejacorretousar S3 ou EFS depende de como você está usando os arquivos que possui.

Para o seu banco de dados, você pode considerar usar o RDS, talvez usando uma classe de instância expansível ou uma das opções sem servidor. Mas isso dependerá do seu orçamento e caso de uso.

Question 2

Em geral, na nuvem é bom tentar usar serviços em vez de servidores. Você precisa ficar de olho no custo, mas isso pode tornar as soluções mais robustas, rápidas e compatíveis.

Tenho algumas idéias sobre sua carga de trabalho:

Você pode usar um orquestrador como funções AWS Step chamando muitas funções lambda da AWS para fazer o cálculo? Observo que lambda é provavelmente o tempo de computação mais caro na AWS, então talvez não seja o ideal. Com os limites definidos corretamente e uma carga de trabalho adequada, talvez você possa iniciar 10.000 lambdas e fazer o trabalho em paralelo em 15 minutos.
Em vez de EFS/S3, que tal criar uma imagem/AMI dourada do EC2 e, para cada trabalho, criar uma instância spot/dinâmica do EC2 grande o suficiente para fazer o processamento daquele trabalho ser encerrado quando estiver concluído? Lambda poderia talvez orquestrar o trabalho com base em algum tipo de evento? Isso evitaria cobranças de transferência de dados - embora não tenha certeza se elas são cobradas do EBS/S3 ou não. A computação spot é bastante barata e, se você escolher corretamente o tamanho da região/AZ/instância, as interrupções deverão ser raras. As instâncias interrompidas são encerradas e o volume do EBS mantido, portanto, isso funcionaria melhor se o seu trabalho fosse gravado no disco regularmente e pudesse ser reiniciado.

Eu provavelmente também dedicaria algum tempo para otimizar esse enorme trabalho.

Answer

Em geral, na nuvem é bom tentar usar serviços em vez de servidores. Você precisa ficar de olho no custo, mas isso pode tornar as soluções mais robustas, rápidas e compatíveis.

Tenho algumas idéias sobre sua carga de trabalho:

Você pode usar um orquestrador como funções AWS Step chamando muitas funções lambda da AWS para fazer o cálculo? Observo que lambda é provavelmente o tempo de computação mais caro na AWS, então talvez não seja o ideal. Com os limites definidos corretamente e uma carga de trabalho adequada, talvez você possa iniciar 10.000 lambdas e fazer o trabalho em paralelo em 15 minutos.
Em vez de EFS/S3, que tal criar uma imagem/AMI dourada do EC2 e, para cada trabalho, criar uma instância spot/dinâmica do EC2 grande o suficiente para fazer o processamento daquele trabalho ser encerrado quando estiver concluído? Lambda poderia talvez orquestrar o trabalho com base em algum tipo de evento? Isso evitaria cobranças de transferência de dados - embora não tenha certeza se elas são cobradas do EBS/S3 ou não. A computação spot é bastante barata e, se você escolher corretamente o tamanho da região/AZ/instância, as interrupções deverão ser raras. As instâncias interrompidas são encerradas e o volume do EBS mantido, portanto, isso funcionaria melhor se o seu trabalho fosse gravado no disco regularmente e pudesse ser reiniciado.

Eu provavelmente também dedicaria algum tempo para otimizar esse enorme trabalho.

Conselhos de arquitetura AWS - múltiplas instâncias EC2 com banco de dados/sistema de arquivos compartilhado com início e parada dinâmicos

Responder1

Responder2

informação relacionada