3과목 데이터 분석모형 평가모형 검증 & 평가 심화

데이터 분할(학습/검증/평가)에 대한 설명으로 옳은 것은?

핵심 개념

부트스트랩은 복원추출, 교차검증은 k번 반복. AUC는 1에 가까울수록 우수합니다.

분할: 학습(생성)/검증(튜닝)/평가(최종) 교차검증: k-fold, 모든 데이터 1회 평가 부트스트랩: 복원추출, 원본 크기 AUC: ROC 면적, 0~1 (0.5=무작위, 1=우수) 불균형 데이터: 정확도만 신뢰 X 함정: 부트스트랩 비복원, AUC 범위(0~100) 혼동

예시: '복원추출로 원본 크기 표본을 반복 생성하는 기법은?' → 부트스트랩

해설

평가(Test) 데이터는 학습에 전혀 사용하지 않고 모형의 최종 일반화 성능을 측정하는 데 쓰입니다. 학습 데이터(d)는 모형을 만드는 데, 검증 데이터(b)는 하이퍼파라미터 조정·모형 선택에 쓰여 학습에 직접 사용되지 않으며, 같은 데이터로 학습·평가하면(a) 과대적합되어 성능이 부풀려집니다.

같은 패턴 관련 문항