정의

  • 데이터 레이크(Data Lake)
    다양한 형태(정형·비정형·반정형)의 데이터를 원본 그대로 저장하고, 필요 시 분석·처리하는 대규모 데이터 저장소.
  • 데이터 웨어하우스(Data Warehouse)
    의사결정을 지원하기 위해 정형화된 데이터를 주제별·통합적으로 저장하고, 분석·조회 목적에 최적화한 데이터베이스.

 

비교

 

구분 데이터 레이크 데이터 웨어하우스
데이터 형태 정형·비정형·반정형 모두 정형 데이터 위주
저장 목적 원시 데이터 저장, 분석 유연성 분석·리포팅 최적화
사용자 데이터 사이언티스트, 엔지니어 분석가, 비즈니스 사용자
쿼리 성능 크기가 커짐에 따라 쿼리 성능 저하 빠른 읽기 및 분석 쿼리
비용 스토리지 비용이 상대적으로 저렴 고비용 투자 필요
데이터 신뢰성 신뢰성 유지 어려움 구조화된 데이터이기 때문에 신뢰성 유지

'IT Tech.' 카테고리의 다른 글

AI 거버넌스  (2) 2025.08.08
빅데이터 분석 단계  (4) 2025.08.08
V 모델(V-Model) 정의 및 절차  (1) 2025.08.07
폭포수 모델 (Waterfall Model) 정의 및 개발 절차, 장단점  (0) 2025.08.06
프록시(Proxy) 디자인 패턴  (0) 2025.08.05

+ Recent posts