2과목 데이터 분석 기획분석 방법론KDD vs CRISP-DM 단계 구분

다음 작업은 KDD 방법론의 어느 단계에 해당하는가? '데이터의 잡음, 이상값, 결측값을 확인한 후 필요 시 제거하여 정제한다.'

핵심 개념

잡음·이상값·결측값 제거는 KDD의 '데이터 전처리' 단계입니다.

'전개·6단계'면 CRISP-DM, '5단계'면 KDD.

KDD (5단계): 선택 → 전처리 → 변환 → 마이닝 → 해석/평가 CRISP-DM (6단계): 업무 이해 → 데이터 이해 → 준비 → 모델링 → 평가 → 전개(Deployment) 함정: '전개'를 KDD에 끼워 넣어 출제

예시: '잡음·이상값·결측값을 식별하고 제거하는 단계는?' → KDD에서 데이터 전처리(Preprocessing)

해설

잡음·이상값·결측값 식별 및 제거(정제)는 KDD 2단계인 데이터 전처리입니다. ① 데이터 변환은 차원 축소·선별 단계로, 단계별 작업 정의를 뒤바꾼 정의 뒤바꿈(❷) 함정이 자주 출제됩니다.

같은 패턴 관련 문항