Amazon Redshift Spectrum позволяет вам выполнять запросы непосредственно к вашим данным, хранящимся в Amazon S3. Похоже, что это также является целью нового сервиса Amazon S3 Select. Каковы основные различия между этими двумя сервисами? Почему мне следует выбрать один из них?
решение1
S3 Select ориентирован на извлечение данных из S3 с помощью SQL:
S3 Select позволяет приложениям извлекать только подмножество данных из объекта с помощью простых выражений SQL. Используя S3 Select для извлечения только тех данных, которые необходимы вашему приложению, вы можете добиться радикального повышения производительности — во многих случаях вы можете получить улучшение на 400% по сравнению с классическим извлечением S3.
Redshift Spectrum позволяет запрашивать данные S3 напрямую из кластера AWS Redshift:
Amazon Redshift Spectrum позволяет вам запускать запросы Amazon Redshift SQL к эксабайтам данных в Amazon S3. С Redshift Spectrum вы можете расширить аналитическую мощь Amazon Redshift за пределы данных, хранящихся на локальных дисках в вашем хранилище данных, чтобы запрашивать огромные объемы неструктурированных данных в вашем «озере данных» Amazon S3
Athena ориентирована на извлечение, преобразование и загрузку (ETL) данных из S3 и имеет хорошую интеграцию с AWS Glue:
Athena проста в использовании. Просто укажите данные в Amazon S3, определите схему и начните выполнять запросы с использованием стандартного SQL. Большинство результатов выдаются в течение нескольких секунд. С Athena нет необходимости в сложных заданиях ETL для подготовки данных к анализу. Это позволяет любому человеку с навыками SQL быстро анализировать крупномасштабные наборы данных.
Использованная литература:Афина,СпектриS3 Выбрать