3과목 데이터 분석데이터 마이닝분류 알고리즘 (SVM·KNN·나이브베이즈)
서포트벡터머신(SVM)에 대한 설명으로 옳은 것은?
- (a)두 클래스 사이의 마진(margin)을 최대화하는 초평면을 찾는다정답
- (b)비선형 분류는 전혀 수행할 수 없다
- (c)마진을 최소화하는 방향으로 학습한다
- (d)서포트 벡터는 결정 경계에서 가장 먼 데이터 점이다
핵심 개념
SVM은 마진 최대화, KNN은 게으른 학습, 나이브베이즈는 조건부 독립 가정입니다.
SVM: 마진 최대화 초평면 (커널로 비선형)
KNN: 가까운 k개 다수결, 게으른 학습(거리 기반)
나이브베이즈: 베이즈 정리 + 조건부 독립 가정
로지스틱: 범주형 종속변수 분류
함정: SVM 마진 최소화, KNN 사전 학습, 나이브 상관 전제로 속임
예시: '변수 간 조건부 독립을 가정하는 분류기는?' → 나이브베이즈
해설
SVM은 두 클래스를 구분하는 결정 경계(초평면)와 가장 가까운 데이터 점들 사이의 마진을 최대화하여 분류 성능을 높입니다. 마진은 최소화가 아니라 최대화하며(c), 커널 기법으로 비선형 분류도 가능하고(b), 서포트 벡터는 결정 경계에 '가장 가까운' 데이터 점입니다(d).