이변량 자료의 분석
반응변수 설명변수 |
범주형 자료 | 연속형 자료 |
범주형 자료 | 교차분석 | 분산분석 |
연속형 자료 | 로지스틱 회귀분석 | 회귀분석 |
적합도 검정(Goodness of fit)
- 적합도 - 실험 또는 관측 결과와 이론적인 기댓값의 일치 정도
- 관측도수 - 실험 또는 관측된 도수
- 기대도수 - 귀무가설이 사실인 경우 기대되는 도수
기대도수 구하는 법
각 범주의 비율은 $p10, p20, ..., pk$라고 하고, 전체 관측치가 N이라면 $e_i = N * P_i$
예를 들어 300번의 주사위가 공정하다면$ e_i = 300 *\frac{1}{6} = 50$
귀무가설:$p_1 = p10, p_2 = p20, ... ,pk = pk0$
검정통계량 구하는 법
관측도수와 기대도수의 차$n_i - e_i$의 차가 작을수록 적합
검정통계량 =$x^2_0 = \sum \frac{(n_i - e_i)^2}{e_i} \sim X^2(k-1)$, 자유도가 k-1인 카이제곱 분포
검정통계량 쉽게 구하는 법
(n-e)^2/e = (관측도수 - 기대도수)^2 / 기대도수
적합도 검정 절차
- 가설 설정: 각 범주의 비율에 따라 분포된다.
- 검정통계량 계산:$x^2_0 = \sum \frac{(n_i - e_i)^2}{e_i} \sim X^2(k-1)$
- p-value 계산: 자유도가 k-1인 카이제곱 분포에서 다음 확률 계산 $P(X^2(k-1)\geq X^2_0) = p-value = CHISQ.DIST.RT(X^2_0, k-1)$
- 임계값 계산: CHISQ.INV(0.95, 자유도)
동질성 검정(Test of homogeneity)
어떤 특성이 여러 집단에 대하여 동일한지 여부 검정
동질성 검정 절차
- 가설 설정 H0: 각 범주별 비율이 동일하다.
- 기대도수 계산: 집단 내 합계*집단 간 합계 / 총 합계
- 검정통계량 계산(자유도가 (k-1)(l-1)인 카이제곱 분포 $X^2_0 = \sum \sum \frac{(Nij - Eij)^2}{Eij}$
- p-value 계산 자유도가 (k-1)(l-1)인 카이제곱 분포에서 다음 확률 계산$P(X^2(k-1)(l-1)\geq X^2_0) = p-value = CHISQ.DIST.RT(X^2_0, (k-1)(l-1)$
독립성 검정(Test of independence)
한 모집단의 두 속성 A, B에 대하여 두 속성이 서로 관련성이 있는지 검정, 검정 방법은 동질성 검정과 동일하다.
'전산통계 > 강의노트' 카테고리의 다른 글
chapter10 - 상관분석과 회귀분석 (0) | 2023.06.05 |
---|---|
chapter 8 - 분산분석 (0) | 2023.06.03 |
chapter 7 - 가설검정 (0) | 2023.06.03 |
chapter 6 - 통계적 추정 (0) | 2023.05.17 |