정의
- 데이터 레이크(Data Lake)
다양한 형태(정형·비정형·반정형)의 데이터를 원본 그대로 저장하고, 필요 시 분석·처리하는 대규모 데이터 저장소. - 데이터 웨어하우스(Data Warehouse)
의사결정을 지원하기 위해 정형화된 데이터를 주제별·통합적으로 저장하고, 분석·조회 목적에 최적화한 데이터베이스.
비교
| 구분 | 데이터 레이크 | 데이터 웨어하우스 |
| 데이터 형태 | 정형·비정형·반정형 모두 | 정형 데이터 위주 |
| 저장 목적 | 원시 데이터 저장, 분석 유연성 | 분석·리포팅 최적화 |
| 사용자 | 데이터 사이언티스트, 엔지니어 | 분석가, 비즈니스 사용자 |
| 쿼리 성능 | 크기가 커짐에 따라 쿼리 성능 저하 | 빠른 읽기 및 분석 쿼리 |
| 비용 | 스토리지 비용이 상대적으로 저렴 | 고비용 투자 필요 |
| 데이터 신뢰성 | 신뢰성 유지 어려움 | 구조화된 데이터이기 때문에 신뢰성 유지 |
'IT Tech.' 카테고리의 다른 글
| AI 거버넌스 (2) | 2025.08.08 |
|---|---|
| 빅데이터 분석 단계 (4) | 2025.08.08 |
| V 모델(V-Model) 정의 및 절차 (1) | 2025.08.07 |
| 폭포수 모델 (Waterfall Model) 정의 및 개발 절차, 장단점 (0) | 2025.08.06 |
| 프록시(Proxy) 디자인 패턴 (0) | 2025.08.05 |