본문 바로가기
전산통계/강의노트

chapter 6 - 통계적 추정

by 세인트킴 2023. 5. 17.

점추정(Point Estimation)

모집단의 특성인 모평균, 모표준편차, 모비율 등을 표본을 이용하여 하나의 값으로 예측

모평균(모분산, 모비율)의 추정량 중 불편추정량이면서 분산이 가장 작은 추정량은 표본평균(표본분산, 표본비율)

모수 추정량
모평균$(\mu)$ $\bar X = \frac{1}{n}\sum X_i$
모분산$\sigma^2$ $S^2 = \frac{1}{n - 1}\sum (X_i -\bar X)^2$
모비율(p) $\hat{p} = \frac{X}{n}$

통계량

표본평균$\bar X = \frac{1}{n} \sum X_i\sim N(\mu, \frac{\sigma^2}{n})$ 

표본분산$S^2 = \frac{1}{n - 1}\sum (X_i - \bar X)^2$

표본비율$\hat{p} = \frac{X}{n}\sim B(n, p)$

자유도$\frac{(n -1)S^2}{\sigma^2} \sim X^2(n - 1)$ 

좋은 추정량의 기준

불편성(unbiasedness) 편중되지 않았다. 오차가 적다는 뜻 $E(\hat{\theta}) = \theta $ 

유효성 분산이 더 작은 추정량

일치성 표본의 크기가 커짐에 따라 불편추정량에 가까워진다.$E(\hat{\theta}) = \frac{n - 1}{n}\theta \to \theta$

표본분산의 분모가 n -1인 이유

표본분산의 모분산$(\sigma^2)$의 불편추정량이 되도록 하기 위해,$E(S^2) = \sigma^2$ 

점 추정량 구하는 방법

1. 적률법 $E(X^k) = \frac{1}{n}\sum X^k_i, k = 1,2,...,n$ 

2. 최대우도추정법 우도함수 $f(x_1, x_2, ..., x_n; \theta$를 최대로 하는 추정값

구간추정

점추정은 한 통계량 값으로 모수의 값을 추정하는 방법인데, 표본오차 만큼의 오차 범위 발생한다. 표본오차 만큼의 범위를 감안하여 모수를 포함할 구간으로 추정하는 것을 구간추정이라고 한다. 

 

모분산 $\sigma^2$을 아는 경우 

확률표본 $\bar X \sim N(\mu, \frac{\sigma^2}{n})$, 표준화 $\frac{\bar X - \mu}{\sigma / \sqrt(n)} \sim N(0, 1)$ 

모비율

모비율의 추정량 = $ \hat p = \frac{X}{n}$

추정량의 표준오차 = $\sqrt \frac{\hat p(1- \hat p)}{n}$

신뢰도 95%의 오차한계 = $1.96 * \sqrt \frac{\hat p(1- \hat p)}{n}$

신뢰도 95% 신뢰구간 = $1.96 * \sqrt \frac{\hat p(1- \hat p)}{n}$

모비율 추정에서의 표본 크기

모비율 p의 신뢰도 95% 신뢰구간 = $\hat p - 1.96*\sqrt \frac{\hat p(1-p)}{n}, \hat p + 1.96*\sqrt \frac{\hat p(1-p)}{n}$

최대허용 표본오차 =$1.96*\sqrt \frac{1}{4n}$

오차의 한계를 d 이하로 하려면 표본의 크기는 = $n > \frac{1}{4}*(\frac{1.96}{d})^2$

모평균 추정에서 표본 크기

모평균$\mu$의 신뢰도 95%구간 $\bar X - 1.96 *\frac{\sigma}{\sqrt n}, \bar X + 1.96 *\frac{\sigma}{\sqrt n}$

오차 = $1.96*\frac{\sigma}{\sqrt n}$

오차의 한계를 d이하로 하려면 표본의 크기는 = $n > (1.96*\frac{\sigma}{d})^2$

 

'전산통계 > 강의노트' 카테고리의 다른 글

chapter10 - 상관분석과 회귀분석  (0) 2023.06.05
chapter9 - 범주형 자료분석(교차분석)  (0) 2023.06.04
chapter 8 - 분산분석  (0) 2023.06.03
chapter 7 - 가설검정  (0) 2023.06.03