3과목 데이터 분석다변량 분석다변량 분석 (차원축소·상관)
상관분석(Correlation Analysis)에 대한 설명으로 옳은 것은?
- (a)상관계수가 0이면 두 변수는 어떤 관계도 존재하지 않는다
- (b)피어슨 상관계수는 -1에서 1 사이의 값을 가진다정답
- (c)상관계수의 절댓값이 작을수록 선형관계가 강하다
- (d)상관관계는 항상 인과관계를 의미한다
핵심 개념
PCA·MDS·요인분석은 모두 차원축소. 상관관계는 인과관계가 아닙니다.
PCA: 분산 최대 주성분
MDS: 거리 보존 저차원 시각화
요인분석: 잠재 공통요인 추출
→ 셋 다 차원 축소 (확장 아님)
상관계수: -1~1, 상관≠인과, 0은 선형관계 없음
함정: 차원 확장으로 서술, 상관=인과로 단정
예시: '개체 간 거리를 보존하며 저차원에 시각화하는 기법은?' → MDS
해설
피어슨 상관계수는 -1에서 1 사이의 값으로 두 변수의 선형관계 강도와 방향을 나타냅니다. 절댓값이 클수록(c) 선형관계가 강하고, 상관관계(d)는 인과관계를 의미하지 않으며(상관≠인과), 상관계수가 0이어도(a) 비선형 관계는 존재할 수 있어 '선형' 관계가 없다는 의미로 해석해야 합니다.