3과목 데이터 분석통계학 개론기술통계 (대푯값·산포·분포형태)
대푯값에 대한 설명으로 옳은 것은?
- (a)최빈값(Mode)은 항상 데이터에 하나만 존재한다
- (b)평균(Mean)은 이상값의 영향을 전혀 받지 않는다
- (c)중앙값은 모든 데이터를 더한 후 개수로 나눈 값이다
- (d)중앙값(Median)은 이상값의 영향을 평균보다 적게 받는다정답
핵심 개념
왜도는 좌우 비대칭, 첨도는 뾰족함. 중앙값은 이상값에 강건합니다.
평균: 이상값에 민감
중앙값: 이상값에 강건
변동계수: 단위 다를 때 산포 비교
왜도: 좌우 비대칭 (양수=오른쪽 꼬리)
첨도: 분포의 뾰족한 정도
함정: 왜도↔첨도 정의 뒤바꿈, 표준편차는 분산의 제곱근(제곱 아님)
예시: '분포가 오른쪽으로 긴 꼬리를 가지면?' → 왜도 양수 (첨도는 뾰족함 측정)
해설
중앙값은 데이터를 정렬했을 때 가운데 위치한 값으로, 극단적인 이상값의 영향을 평균보다 덜 받습니다. 평균(b)은 모든 값을 반영하므로 이상값에 민감하고, 최빈값(a)은 여러 개거나 없을 수도 있으며, c는 평균(산술평균)의 정의입니다.