3과목 데이터 분석군집 분석군집 분석 & 실루엣

계층적 군집분석(Hierarchical Clustering)에 대한 설명으로 옳은 것은?

핵심 개념

계층적·DBSCAN은 군집 수가 불필요, K-means는 필요. 실루엣은 1에 가까울수록 좋습니다.

계층적: 덴드로그램, k 사후 결정, 계산량 많음 K-means: k 사전 지정 DBSCAN: 밀도 기반, k 불필요, 이상치 탐지 거리: 최단·최장·평균·중심 연결법 실루엣: -1~1 (1에 가까울수록 우수) 함정: 계층적이 k 필요, 실루엣 범위(0~100) 혼동

예시: '군집 수를 미리 지정하지 않는 밀도 기반 기법은?' → DBSCAN

해설

계층적 군집분석은 덴드로그램이라는 나무 형태의 그림으로 군집이 병합되는 과정을 시각화합니다. 군집 수(b)를 미리 정하는 것은 K-means이며 계층적 군집은 덴드로그램을 잘라 사후에 결정하고, 계산량이 많아(d) 대용량 데이터에는 부적합하며, 군집 간 거리(c)를 기준으로 병합을 진행합니다.

같은 패턴 관련 문항