Mit Amazon Redshift Spectrum können Sie Abfragen direkt auf Ihre in Amazon S3 gespeicherten Daten ausführen. Dies scheint auch der Zweck des neuen Amazon S3 Select-Dienstes zu sein. Was sind die Hauptunterschiede zwischen diesen beiden Diensten? Warum sollte ich den einen dem anderen vorziehen?
Antwort1
S3 Select konzentriert sich auf das Abrufen von Daten aus S3 mittels SQL:
S3 Select ermöglicht es Anwendungen, mithilfe einfacher SQL-Ausdrücke nur eine Teilmenge der Daten aus einem Objekt abzurufen. Indem Sie S3 Select verwenden, um nur die von Ihrer Anwendung benötigten Daten abzurufen, können Sie die Leistung drastisch steigern – in vielen Fällen ist eine Verbesserung von bis zu 400 % im Vergleich zum klassischen S3-Abruf möglich.
Redshift Spectrum ermöglicht die Abfrage von S3-Daten direkt von Ihrem AWS Redshift-Cluster:
Mit Amazon Redshift Spectrum können Sie Amazon Redshift SQL-Abfragen für Exabyte an Daten in Amazon S3 ausführen. Mit Redshift Spectrum können Sie die Analyseleistung von Amazon Redshift über die auf lokalen Festplatten in Ihrem Data Warehouse gespeicherten Daten hinaus erweitern, um große Mengen unstrukturierter Daten in Ihrem Amazon S3 „Data Lake“ abzufragen.
Athena konzentriert sich auf das Extrahieren, Transformieren und Laden (ETL) von Daten aus S3 und verfügt über eine gute Integration mit AWS Glue:
Athena ist einfach zu verwenden. Zeigen Sie einfach auf Ihre Daten in Amazon S3, definieren Sie das Schema und beginnen Sie mit der Abfrage mit Standard-SQL. Die meisten Ergebnisse werden innerhalb von Sekunden geliefert. Mit Athena sind keine komplexen ETL-Jobs erforderlich, um Ihre Daten für die Analyse vorzubereiten. So kann jeder mit SQL-Kenntnissen schnell große Datensätze analysieren.
Verweise:Athene,SpektrumUndS3-Auswahl