단계 주요 내용
① 데이터 수집 내부·외부의 정형·비정형 데이터 확보
주요 기술 : 로그 수집기, 각종 센서, 크롤링, ETL, Open API
② 데이터 준비 (저장/처리) 데이터 전처리 및 EDA (탐색적 데이터 분석, Exploratory Data Analysis)
분산 파일 시스템, 데이터베이스, 클라우드 스토리지에 저장 및 전처리
※ EDA :
    > 중요한 Variable과 중요하지 않은 Variable을 구분
    > Missing/Dirty Value 파악
    > Variable 간의 관계 파악
③ 데이터 분석 통계 분석, 머신러닝, 딥러닝 등 기법 활용하여 분석
④ 시각화 및 해석 분석 결과를 시각적으로 표현하여 의미 도출
⑤ 활용 및 피드백 의사결정 반영, 서비스 개선, 모델 고도화
 

+ Recent posts