O Amazon Redshift Spectrum permite executar consultas diretamente nos dados armazenados no Amazon S3. Este também parece ser o objetivo do novo serviço Amazon S3 Select. Quais são as principais diferenças entre esses dois serviços? Por que devo escolher um em vez do outro?
Responder1
O S3 Select está focado na recuperação de dados do S3 usando SQL:
S3 Select permite que os aplicativos recuperem apenas um subconjunto de dados de um objeto usando expressões SQL simples. Ao usar o S3 Select para recuperar apenas os dados necessários ao seu aplicativo, você pode obter aumentos drásticos de desempenho – em muitos casos, você pode obter uma melhoria de até 400% em comparação com a recuperação clássica do S3.
O Redshift Spectrum permite consultar dados S3 diretamente do seu cluster AWS Redshift:
O Amazon Redshift Spectrum permite executar consultas SQL do Amazon Redshift em exabytes de dados no Amazon S3. Com o Redshift Spectrum, você pode estender o poder analítico do Amazon Redshift além dos dados armazenados em discos locais no seu data warehouse para consultar grandes quantidades de dados não estruturados no seu “data lake” do Amazon S3
Athena está focada em extrair, transformar e carregar dados (ETL) do S3 e tem uma boa integração com AWS Glue:
Atenas é fácil de usar. Basta apontar para seus dados no Amazon S3, definir o esquema e começar a consultar usando SQL padrão. A maioria dos resultados é entregue em segundos. Com o Athena, não há necessidade de trabalhos complexos de ETL para preparar seus dados para análise. Isso torna mais fácil para qualquer pessoa com habilidades em SQL analisar rapidamente conjuntos de dados em grande escala.
Referências:Atenas,EspectroeS3 Selecionar