Diferencia entre Amazon S3 Select y Amazon Redshift Spectrum

Diferencia entre Amazon S3 Select y Amazon Redshift Spectrum

Amazon Redshift Spectrum le permite ejecutar consultas directamente en sus datos almacenados en Amazon S3. Éste también parece ser el objetivo del nuevo servicio Amazon S3 Select. ¿Cuáles son las principales diferencias entre estos dos servicios? ¿Por qué debería elegir uno sobre el otro?

Respuesta1

S3 Select se centra en recuperar datos de S3 usando SQL:

S3 Select permite que las aplicaciones recuperen solo un subconjunto de datos de un objeto mediante expresiones SQL simples. Al utilizar S3 Select para recuperar solo los datos que necesita su aplicación, puede lograr aumentos drásticos en el rendimiento; en muchos casos puede obtener hasta un 400 % de mejora en comparación con la recuperación clásica de S3.

Redshift Spectrum permite consultar datos de S3 directamente desde su AWS Redshift Cluster:

Amazon Redshift Spectrum le permite ejecutar consultas SQL de Amazon Redshift en exabytes de datos en Amazon S3. Con Redshift Spectrum, puede ampliar el poder analítico de Amazon Redshift más allá de los datos almacenados en discos locales en su almacén de datos para consultar grandes cantidades de datos no estructurados en su “lago de datos” de Amazon S3.

Athena se centra en extraer, transformar y cargar datos (ETL) de S3 y tiene una buena integración con AWS Glue:

Atenas es fácil de usar. Simplemente señale sus datos en Amazon S3, defina el esquema y comience a realizar consultas utilizando SQL estándar. La mayoría de los resultados se entregan en segundos. Con Athena, no hay necesidad de realizar trabajos ETL complejos para preparar sus datos para el análisis. Esto facilita que cualquier persona con conocimientos de SQL analice rápidamente conjuntos de datos a gran escala.

Referencias:Atenea,EspectroySeleccionar S3

información relacionada