3과목 데이터 분석데이터 마이닝의사결정나무 알고리즘 분류기준

이산형 종속변수에 지니계수를 분리 기준으로 사용하는 의사결정나무 알고리즘은?

핵심 개념

이산형 분류 기준: CART=지니, CHAID=카이제곱, C5.0=엔트로피입니다.

CART=지니, CHAID=카이, C5.0=엔트로피. 매칭 뒤바꿈 함정.

CART: 이산=지니계수, 연속=분산감소량, 이진 분리 CHAID: 이산=카이제곱, 연속=ANOVA F, 가지치기 X C5.0: 엔트로피, 다지 분리 함정: 지니↔엔트로피↔카이제곱 뒤바꿈

예시: '범주형 종속변수에 지니지수, 연속형 종속변수에 분산감소량을 사용하는 알고리즘은?' → CART

해설

CART는 이산형에 지니계수, 연속형에 분산감소량을 사용합니다. ① CHAID는 카이제곱, ③ C5.0은 엔트로피로 분류 기준 매칭이 뒤바뀐 정의 뒤바꿈(❷) 함정의 단골 보기입니다.

같은 패턴 관련 문항