Amazon S3 Select와 Amazon Redshift Spectrum의 차이점

Amazon S3 Select와 Amazon Redshift Spectrum의 차이점

Amazon Redshift Spectrum을 사용하면 Amazon S3에 저장된 데이터에 대해 직접 쿼리를 실행할 수 있습니다. 이는 새로운 Amazon S3 Select 서비스의 목적이기도 한 것 같습니다. 이 두 서비스의 주요 차이점은 무엇입니까? 왜 다른 것보다 하나를 선택해야 합니까?

답변1

S3 Select는 SQL을 사용하여 S3에서 데이터를 검색하는 데 중점을 둡니다.

S3 Select를 사용하면 애플리케이션이 간단한 SQL 표현식을 사용하여 객체에서 데이터의 하위 집합만 검색할 수 있습니다. S3 Select를 사용하여 애플리케이션에 필요한 데이터만 검색하면 성능이 크게 향상될 수 있습니다. 대부분의 경우 기존 S3 검색에 비해 최대 400% 향상된 성능을 얻을 수 있습니다.

Redshift Spectrum을 사용하면 AWS Redshift 클러스터에서 직접 S3 데이터를 쿼리할 수 있습니다.

Amazon Redshift Spectrum을 사용하면 Amazon S3에 있는 엑사바이트 규모의 데이터에 대해 Amazon Redshift SQL 쿼리를 실행할 수 있습니다. Redshift Spectrum을 사용하면 데이터 웨어하우스의 로컬 디스크에 저장된 데이터 이상으로 Amazon Redshift의 분석 능력을 확장하여 Amazon S3 "데이터 레이크"에 있는 방대한 양의 비정형 데이터를 쿼리할 수 있습니다.

Athena는 S3에서 ETL(추출, 변환 및 로드) 데이터에 중점을 두고 있으며 AWS Glue와 잘 통합되어 있습니다.

아테나는 사용하기 쉽습니다. Amazon S3의 데이터를 가리키고 스키마를 정의한 후 표준 SQL을 사용하여 쿼리를 시작하기만 하면 됩니다. 대부분의 결과는 몇 초 내에 제공됩니다. Athena를 사용하면 분석용 데이터를 준비하기 위해 복잡한 ETL 작업이 필요하지 않습니다. 이를 통해 SQL 기술이 있는 사람이라면 누구나 대규모 데이터 세트를 신속하게 분석할 수 있습니다.

참고자료:아테나,스펙트럼그리고S3 선택

관련 정보