Amazon S3 Select 和 Amazon Redshift Spectrum 之間的區別

Amazon S3 Select 和 Amazon Redshift Spectrum 之間的區別

Amazon Redshift Spectrum 讓您可以直接針對 Amazon S3 中儲存的資料執行查詢。這似乎也是新的 Amazon S3 Select 服務的目的。這兩種服務之間的主要區別是什麼?我為什麼要選擇其中一個而不是另一個?

答案1

S3 Select 專注於使用 SQL 從 S3 檢索資料:

S3 Select 使應用程式能夠使用簡單的 SQL 表達式僅檢索物件中的資料子集。透過使用 S3 Select 僅檢索應用程式所需的數據,您可以獲得顯著的效能提升 - 在許多情況下,與經典 S3 檢索相比,您可以獲得高達 400% 的改進。

Redshift Spectrum 支援直接從 AWS Redshift 叢集查詢 S3 資料:

Amazon Redshift Spectrum 讓您能夠針對 Amazon S3 中的 EB 資料執行 Amazon Redshift SQL 查詢。透過 Redshift Spectrum,您可以將 Amazon Redshift 的分析能力擴展到資料倉儲中本機磁碟上儲存的資料之外,以查詢 Amazon S3「資料湖」中的大量非結構化資料

Athena 專注於從 S3 中提取、轉換和載入 (ETL) 數據,並與 AWS Glue 具有良好的整合:

雅典娜很容易使用。只需指向 Amazon S3 中的數據,定義架構,然後開始使用標準 SQL 查詢。大多數結果可在幾秒鐘內交付。借助 Athena,無需複雜的 ETL 作業即可準備資料進行分析。這使得任何具有 SQL 技能的人都可以輕鬆快速分析大規模資料集。

參考:雅典娜,光譜S3選擇

相關內容