3과목 데이터 분석데이터 마이닝배깅 vs 부스팅 + 랜덤포레스트
배깅과 부스팅의 차이로 옳은 것은?
- (a)배깅은 잘못 분류된 데이터에 큰 가중치, 부스팅은 동일 가중치를 부여한다
- (b)두 기법은 가중치 부여 방식이 동일하다
- (c)배깅은 동일 가중치 + 보팅, 부스팅은 잘못 분류된 데이터에 큰 가중치를 부여한다정답
- (d)배깅은 순차 학습이고 부스팅은 병렬 학습이다
핵심 개념
배깅은 동일 가중치·보팅, 부스팅은 잘못 분류된 데이터에 큰 가중치입니다.
배깅=동일 가중치(병렬). 부스팅=가중치 부여(순차).
배깅 (Bagging):
- 복원추출, 동일 가중치
- 보팅(다수결) 결합 → 분산 감소
부스팅 (Boosting):
- 오분류 데이터에 큰 가중치
- 순차 학습
랜덤포레스트 = 배깅 + 변수 랜덤 추출
함정: 가중치·결합 방식 뒤바꿈
예시: '잘못 분류된 데이터에 더 큰 가중치를 부여하여 순차 학습하는 기법은?' → 부스팅(Boosting)
해설
배깅은 동일 가중치·복원추출·보팅 결합, 부스팅은 잘못 분류된 데이터에 큰 가중치를 주고 순차 학습합니다. ①는 가중치 방식을 뒤바꾼 정의 뒤바꿈(❷), ④는 학습 방식을 뒤바꾼 정의 뒤바꿈(❷) 함정입니다.