패턴 공식

29개 패턴

암묵지 vs 형식지 + SECI 모델

1과목

"노하우→매뉴얼" = 표출화. 순서: 공·표·연·내.

DIKW 피라미드 4단계 매칭

1과목

D-I-K-W 순서. Insight·Intelligence는 함정.

빅데이터 위기 3요인 - 통제방안 매칭

1과목

사생활=책임제, 오용=접근 허용. 매칭 뒤바꿈 주의.

분석 과제 4유형 (What × How)

2과목

대상 O × 방법 O → 최적화. 통찰↔솔루션 뒤바꿈 주의.

거버넌스 3요소 + 위험 대응 4방안

2과목

거버넌스 3 / 위험대응 4. 유사 단어 함정.

KDD vs CRISP-DM 단계 구분

2과목

'전개·6단계'면 CRISP-DM, '5단계'면 KDD.

4척도 구분 (절대 0의 유무)

3과목

절대 0 있으면 비율, 없으면 구간. 키=비율, 온도=구간.

표본추출 4종 (층화 vs 집락 동질성)

3과목

층화 = 층내 동질. 집락 = 집락내 이질. 정반대 출제 주의.

표본분산 vs 모분산 (n-1 vs n)

3과목

표본 = n-1로 나누기. 모집단 = n으로 나누기.

제1종 vs 제2종 오류 + p-value

3과목

1종=참인데 기각. 2종=거짓인데 채택. p<0.05면 기각.

검정용 분포 매핑 + 모수/비모수

3과목

t=평균, F=분산/ANOVA, 카이제곱=적합도/독립성.

회귀모형 평가 3요소 + 변수선택 3법

3과목

Lasso=L1, Ridge=L2. VIF 10 이상이 문제.

결정계수 R² 공식과 범위

3과목

R² = SSR/SST. 범위 0~1 (-1~1 함정).

선형회귀 vs 로지스틱회귀

3과목

연속형 = 선형(lm). 범주형 = 로지스틱(glm).

AR↔PACF / MA↔ACF + 시계열 4구성요소

3과목

AR=PACF 절단, MA=ACF 절단. 매칭 뒤바꿈 함정.

의사결정나무 알고리즘 분류기준

3과목

CART=지니, CHAID=카이, C5.0=엔트로피. 매칭 뒤바꿈 함정.

배깅 vs 부스팅 + 랜덤포레스트

3과목

배깅=동일 가중치(병렬). 부스팅=가중치 부여(순차).

연관분석 3대 측도 + 향상도 1=독립

3과목

향상도=1이면 독립. >1 양의 연관, <1 음의 연관.

오분류표 6대 지표 (Recall vs Precision 분모)

3과목

재현율 분모=실제 True. 정확도 분모=예측 True.

R 데이터 구조 & 핵심 함수

3과목

벡터·행렬은 동일 타입만, 리스트·데이터프레임은 혼합 타입. apply 계열은 '반환형'이 정체입니다.

데이터 전처리 & 변수 가공

3과목

정규화(0~1)와 표준화(평균0·표준편차1)는 다릅니다. 파생변수(가공)와 요약변수(집계)도 구분하세요.

기술통계 (대푯값·산포·분포형태)

3과목

왜도는 좌우 비대칭, 첨도는 뾰족함. 중앙값은 이상값에 강건합니다.

추론통계 & 가설검정 심화

3과목

검정력은 1-β(1-α 아님). 유의수준 α는 제1종 오류, 신뢰수준이 높을수록 구간은 넓어집니다.

분류 알고리즘 (SVM·KNN·나이브베이즈)

3과목

SVM은 마진 최대화, KNN은 게으른 학습, 나이브베이즈는 조건부 독립 가정입니다.

군집 분석 & 실루엣

3과목

계층적·DBSCAN은 군집 수가 불필요, K-means는 필요. 실루엣은 1에 가까울수록 좋습니다.

다변량 분석 (차원축소·상관)

3과목

PCA·MDS·요인분석은 모두 차원축소. 상관관계는 인과관계가 아닙니다.

모형 검증 & 평가 심화

3과목

부트스트랩은 복원추출, 교차검증은 k번 반복. AUC는 1에 가까울수록 우수합니다.

비정형 마이닝 (텍스트·SNA)

3과목

TDM은 단어×문서 행렬. SNA 중심성 4종(연결정도·매개·근접·위세)을 구분하세요.

신경망 (활성화·과적합)

3과목

활성화함수는 비선형 변환. 시그모이드 0~1, ReLU는 음수→0. 과적합은 학습만 잘됩니다.