2과목 데이터 분석 기획분석 방법론KDD vs CRISP-DM 단계 구분
다음 작업은 KDD 방법론의 어느 단계에 해당하는가? '데이터의 잡음, 이상값, 결측값을 확인한 후 필요 시 제거하여 정제한다.'
- (a)데이터 변환
- (b)데이터 마이닝
- (c)데이터셋 선택
- (d)데이터 전처리정답
핵심 개념
잡음·이상값·결측값 제거는 KDD의 '데이터 전처리' 단계입니다.
'전개·6단계'면 CRISP-DM, '5단계'면 KDD.
KDD (5단계):
선택 → 전처리 → 변환 → 마이닝 → 해석/평가
CRISP-DM (6단계):
업무 이해 → 데이터 이해 → 준비 → 모델링 → 평가 → 전개(Deployment)
함정: '전개'를 KDD에 끼워 넣어 출제
예시: '잡음·이상값·결측값을 식별하고 제거하는 단계는?' → KDD에서 데이터 전처리(Preprocessing)
해설
잡음·이상값·결측값 식별 및 제거(정제)는 KDD 2단계인 데이터 전처리입니다. ① 데이터 변환은 차원 축소·선별 단계로, 단계별 작업 정의를 뒤바꾼 정의 뒤바꿈(❷) 함정이 자주 출제됩니다.