본문 바로가기
전산통계/강의노트

chapter9 - 범주형 자료분석(교차분석)

by 세인트킴 2023. 6. 4.

이변량 자료의 분석

반응변수
설명변수
범주형 자료 연속형 자료
범주형 자료 교차분석 분산분석
연속형 자료 로지스틱 회귀분석 회귀분석

적합도 검정(Goodness of fit)

  • 적합도 - 실험 또는 관측 결과와 이론적인 기댓값의 일치 정도
  • 관측도수 - 실험 또는 관측된 도수
  • 기대도수 - 귀무가설이 사실인 경우 기대되는 도수

기대도수 구하는 법

각 범주의 비율은 $p10, p20, ..., pk$라고 하고, 전체 관측치가 N이라면 $e_i = N * P_i$

예를 들어 300번의 주사위가 공정하다면$ e_i = 300 *\frac{1}{6} = 50$

귀무가설:$p_1 = p10, p_2 = p20, ... ,pk = pk0$

검정통계량 구하는 법

관측도수와 기대도수의 차$n_i - e_i$의 차가 작을수록 적합

검정통계량 =$x^2_0 = \sum \frac{(n_i - e_i)^2}{e_i} \sim X^2(k-1)$, 자유도가 k-1인 카이제곱 분포

검정통계량 쉽게 구하는 법

(n-e)^2/e = (관측도수 - 기대도수)^2 / 기대도수

적합도 검정 절차

  1. 가설 설정: 각 범주의 비율에 따라 분포된다.
  2. 검정통계량 계산:$x^2_0 = \sum \frac{(n_i - e_i)^2}{e_i} \sim X^2(k-1)$
  3. p-value 계산: 자유도가 k-1인 카이제곱 분포에서 다음 확률 계산 $P(X^2(k-1)\geq X^2_0) = p-value = CHISQ.DIST.RT(X^2_0, k-1)$
  4. 임계값 계산: CHISQ.INV(0.95, 자유도)

동질성 검정(Test of homogeneity)

어떤 특성이 여러 집단에 대하여 동일한지 여부 검정

동질성 검정 절차

  1. 가설 설정 H0: 각 범주별 비율이 동일하다.
  2. 기대도수 계산: 집단 내 합계*집단 간 합계 / 총 합계
  3. 검정통계량 계산(자유도가 (k-1)(l-1)인 카이제곱 분포 $X^2_0 = \sum \sum \frac{(Nij - Eij)^2}{Eij}$
  4. p-value 계산 자유도가 (k-1)(l-1)인 카이제곱 분포에서 다음 확률 계산$P(X^2(k-1)(l-1)\geq X^2_0) = p-value = CHISQ.DIST.RT(X^2_0, (k-1)(l-1)$

독립성 검정(Test of independence)

한 모집단의 두 속성 A, B에 대하여 두 속성이 서로 관련성이 있는지 검정, 검정 방법은 동질성 검정과 동일하다.

'전산통계 > 강의노트' 카테고리의 다른 글

chapter10 - 상관분석과 회귀분석  (0) 2023.06.05
chapter 8 - 분산분석  (0) 2023.06.03
chapter 7 - 가설검정  (0) 2023.06.03
chapter 6 - 통계적 추정  (0) 2023.05.17