실시간 읽기/쓰기 기능의 속도 관리를 위해 대부분의 관계형 데이터베이스는 특정 용량에서 과도하게 기능하는 경향이 있습니다. 실제로 저장하는 콘텐츠 양에서요. 기록 분석의 문제점은 ‘시작한 이후 생산이 얼마나 개선되었는지 보여줘.’ 같은 질문에 대답하는 데이터가 수집을 멈추지 않는다는 것입니다. 사실 최신 원격 분석과 IoT의 폭발적 증가 때문에 데이터는 결국 최고 용량의 기존 관계형 데이터베이스도 감당할 수 없는 양이 될 것입니다.
갈수록 나빠지겠죠. 볼륨 뿐만 아니라 데이터의 다양성도 문제가 될 수 있습니다. 재고, 금융 및 소매 영업 시스템 같은 다양한 데이터 저장소에서 오는 데이터를 상대로 비즈니스 인텔리전스, 즉 BI 프로젝트를 실행하고 싶으신가요? 여러 데이터베이스에 단일 쿼리를 사용하는 일은 멋지게 들릴지는 몰라도 기존 데이터베이스는 이를 쉽게 처리하지 못합니다.
데이터가 너무 복잡해 기존 관계형 데이터베이스로 처리하기가 어려워지면 데이터 웨어하우스의 세계에 들어가게 됩니다. 데이터 웨어하우스는 이러한 유형의 빅 데이터용으로 특별히 제작되었고, 사용자는 운영 분석이 아닌 기록 분석을 살펴봅니다.
<예시>
여기서 기록이란?
‘지난 1시간 동안 모든 점포에서 기록한 매출을 보여줘.’ 중요한 건 데이터가 설정되었다는 점이죠. 지난 1시간은 이제 과거이므로 현재 판매하는 건은 포함되지 않습니다. 이 질문을 ‘지금 커피 백 재고가 얼마나 있지?’라는 질문과 비교해 보세요. 말하는 이 순간에도 결과가 바뀔 수 있죠. 비즈니스 질문이 과거를 향한다면 해당 비즈니스 인텔리전스에는 데이터 웨어하우스가 올바른 솔루션입니다.
Amazon Redshift
- 빅 데이터 분석에 사용할 수 있는 데이터 웨어하우징 서비스입니다. 이 서비스는 여러 원본에서 데이터를 수집하여 데이터 간의 관계 및 추세를 파악하는 데 도움이 되는 기능을 제공합니다.
- AWS에서 자주 사용하는 솔루션을 이미 실행 중이라면 데이터를 가져오기만 하면 됩니다. 하지만 이를 떠나서 데이터 웨어하우스가 조율되고 복원력을 가지며 지속적으로 규모를 조정하도록 하는 데 아직도 엄청나게 많은 획일적인 작업 부담이 있을지도 모릅니다. 데이터 웨어하우스 팀이 불가피한 관리와 엔진 관리 대신 데이터에만 집중할 수 있습니다.
'AWS > 스토리지 및 데이터베이스' 카테고리의 다른 글
Cloud Adoption Framework, CAF / 6R <Migration> (0) | 2022.04.26 |
---|---|
Amazon Database Migration Service, DMS (0) | 2022.04.24 |
데이터베이스 (0) | 2022.04.24 |
Amazon Elastic File System, EFS (0) | 2022.04.24 |
Amazon Simple Storage Service, Amazon S3 (0) | 2022.04.24 |
댓글